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Essai d’interprétation du fonctionnement 
des cellules vivantes dans le cadre . 
de la cybernétique quantique 


par J. PoLonskxy, ! 


Directeur technique du département « Études-T élévision » 
de la Compagnie Générale de T. S. F. (Paris) 


I. PRÉAMBULE 


Avant d'aborder l'exposé du sujet proprement dit, nous pensons 
qu’il est nécessaire de faire les remarques suivantes : 


1°) L'étude en question a été menée avec le souci de ne pas dé- 
border le domaine strictement physique du sujet. 

Le déterminisme dans la science, avec les limites que lui a impo- 
sées la physique moderne, n’est plus un sujet de discussion. Par 
contre, la finalité dans la nature est une question relevant de la 
métaphysique et tout progrès scientifique ne modifie pas ses données 
fondamentales et n’a pas prise sur elle. 

Cette remarque nous paraît nécessaire avant l'exposé du problème 
pour éviter toute confusion dans l'esprit du lecteur sur le sens que 
nous avons voulu donner à ce travail. 


2°) Le schéma fonctionnel de la cellule vivante a été intentionnelle- 
ment fort simplifié afin de pouvoir dégager plus facilement les bases 
physiques de la physiologie cellulaire. Pour les mêmes raisons, la 
_ différenciation entre cellules dans les organismes supérieurs a été à 
peine évoquée. Au cours de l'exposé de l'hypothèse ainsi que 
dans l’analyse, nous avons fait appel aux concepts de la biochimie 
plutôt qu’à ceux de la biologie, pour les raisons suivantes : 


1. Communication faite au 2° Congrès International de Cybernétique, Namur, le 
3 septembre 1958, sous le titre Quelques réflexions sur l'aspect physique de la vie. 
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a) La terminologie des constituants cellulaires en biologie ainsi 
que l’attribution de leurs fonctions respectives semblent être en 
pleine évolution ; la biochimie, non moins évolutive, nous a paru 
toutefois offrir une base plus solide pour l'édification de notre hy- 
pothèse. : 

b) Le modèle fonctionnel de la cellule qu'on décrit, ne prétend à 
aucune rigueur scientifique et ne présente qu'un schéma analytique 
destiné à montrer l'intérêt de l'introduction de la cybernétique électro- 
magnétique et quantique dans la biologie. 


Le schéma réel de la cellule est d’une complexité extrême, et il 
faudra de nombreuses années de recherches pour pouvoir pénétrer 
plus avant dans l'intimité de la cellule et dans l'interprétation de 
sa structure fine. 


3°) L'hypothèse élaborée ainsi que l'essai des a justification étant 
basés sur une idée de synthèse relevant de plusieurs disciplines scien- 
tifiques (la biologie, la biochimie, la physique et la cybernétique), 
il nous a semblé utile de faire précéder l’exposé proprement dit d’un 
résumé général destiné à donner une vue d’ensemble du problème. 


4°) N’étant pas entièrement familiarisé avec la terminologie con- 
consacrée dans les divers domaines scientifiques abordés au cours 
de cet essai de synthèse, il est possible que nous n’ayons pas toujours 
utilisé le terme exact. Nous nous en excusons auprès des spécialistes. 


II. HYPOTHÈSE DE BASE ET RÉSUMÉ DE L’ETUDE: 
LA CELLULE VIVANTE FONCTIONNE 
COMME UN SYSTEME 
MICROCYBERNÉTIQUE ET QUANTIQUE 


I. OBJET DE L’ETUDE 


Dans l'interprétation des phénomènes biologiques de la vie cel- 
lulaire (métabolisme, division cellulaire, mutations, rapport entre 
le virus et la cellule-hôte, etc.), les biochimistes font de plus en plus 
appel aux notions de spécificité, de sélectivité ou d’effets de réso- 
nance entre les acides nucléiques, les protéines, et d’autres molé- 
cules biologiques ; on parle méme depuis quelque temps d’un code 
d'information dans la cellule. Quelle signification faut-il attribuer 
a ces termes ? Il n’existe pour le moment aucune théorie satisfai- 
sante capable de donner un sens physique à ces notions qui sont à 
la base même de l'interprétation des phénomènes biologiques. 
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L'objet de cette étude est : 


a) de proposer une hypothèse permettant une interprétation 
cohérente de nombreux phénomènes biologiques, et 

b) d'apporter des éléments analytiques en faveur de cette hy- 
pothèse en partant des lois physiques connues. 


2. HYPOTHÈSE DE BASE 


L'hypothèse de base que nous proposons, pourrait s’énoncer 
comme suit : 


Touie cellule vivante fonctionne sur le plan physique comme un 
système microcybernétique électromagnétique obéissant aux lois de 
la mécanique quantique. 


Sur le plan fonctionnel de la cellule, plusieurs modèles pourraient 
être imaginés pour représenter ce système. Au cours de cette étude, 
nous avons adopté comme modèle-type le schéma représenté sur 
la figure 1. Selon ce schéma, le système comporte essentiellement : 


— une source primaire d'informations quantifiées émises sous 
forme de photons et dont le code est défini par sa structure chimique 
ordonnée ; 

—- des sources secondaires et des effecteurs spécifiques en réso- 
nance avec la source primaire. 

Ce système microcybernétique est pris dans le sens physique et 
mathématique de la théorie de l’information. 


ER esos aes fc 
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RER Le Membranes. 


Fic. 1. — Schéma fonctionnel des constituants cellulaires. 
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3. RÔLE DES PRINCIPAUX CONSTITUANTS DANS LE FONCTIONNE- 
MENT CELLULAIRE 


a) Rappel des principaux constituants biochimiques de la cellule. 
Nous rappelons qu’on distingue dans la cellule le noyau et le 
cytoplasme (fig. I). 
Dans le noyau : 


(1) représente les acides désoxyribonucléiques (ADN) ; 
(2) représente les protéines associées aux ADN (P,,4). 


Dans le cytoplasme : 


(3) représente les acides ribonucléiques (ARN) ; 
(4) représente les protéines associées aux ARN (P,4) ; 
(5) représente des enzymes (E). 


— L'association d’un ADN (1!) et d’une protéine donne une ma- 
cromolécule dénommée désoxyribonucléoprotéine (DNP). 

L'ensemble des DNP forme la source primaire d’informations 
située dans le noyau cellulaire. 

— De même, l'association d’un ARN et d’une protéine donne 
une macromolécule dénommée ribonucléoprotéine (RNP). 

Les RNP forment la source secondaire principale d’information 
du cytoplasme. 

— Les enzymes sont des protéines qui fonctionnent comme des 
effecteurs spécifiques. 


b) Fonctions principales de ces constituants dans la vie cellulaire. 


Selon l'hypothèse, les constituants principaux de la cellule auraient 
les fonctions suivantes : 


a) Chaque acide désoxyribonucléique (ADN) du noyau fonctionne 
comme un auto-oscillateur moléculaire émettant des photons. L’in- 
formation spécifique provient de la modulation du flux de photons 
sous forme codée, le code étant constitué par la variété et le mode 
d’enchainement des bases aminées. L’ADN se comporte comme un 
ensemble d’oscillateurs du type « maser » (?) groupés dans une seule 


(??) Les abréviations ADN et ARN correspondent respectivement à DNA et RNA 
en langue anglaise. 

(?) « Maser » est une abréviation anglaise de « Microwave amplification by stimu- 
lated emission of radiation » ou en français « Amplification hyperfréquence par émis- 
sion induite des radiations » (voir Addenda de cet article concernant le mode 
d’oscillations dans les ADN). 
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molécule et fonctionnant sur des fréquences différentes avec répar- 
tition dans le temps. Nous allons dénommer une telle molécule 
« auto-oscillateur polymaser biologique ». 

Le signal codé est représenté sur la figure 2. 

L’ensemble des ADN oscillateurs forme un émetteur multiplex 
d’information des « polymasers » primaires. 


Nota. — Le spectre électromagnétique et le mode d’oscillations 
seront examinés par la suite. 


6) L’acide ribonucléique (ARN) du cytoplasme fonctionne comme 
un amplificateur sélectif du type « polymaser » avec ou sans change- 
ment de fréquence des photons reçus du noyau. Il se comporte 
comme une source secondaire d'informations quantifiées capable 
d’actionner des effecteurs ou des servomécanismes pour exécuter 
la biosynthèse suivant un programme défini par les ADN. 


L'association d’oscillateurs avec des amplificateurs permet d’as- 
surer une grande Stabilité de fonctionnement des oscillateurs et une 
énergie suffisante pour commander des effecteurs. 


y) Les protéines P, px et Prey sous l’effet d’informations reçues des 
ADN ou des ARN, en résonance avec la structure de leurs acides 
aminés, agissent comme effecteurs réversibles. Elles restituent aux 
ADN et aux ARN l’entropie négative que ceux-ci perdent en émet- 
tant ou en amplifiant des photons. La source d'énergie d’origine 
externe est fournie par des dérivés phosphorvlés, hydrolysés sous 
contrôle des protéines. 


Le rôle des protéines Pyroy ét Pray consiste ainsi à maintenir in- 
tacte la structure des acides nucléiques, et notamment : 


— à rétablir les états quantiques d’origine, existant avant l’amor- 
cage d’auto-oscillations ou du régime d'amplification, de sorte que 
le surpeuplement d’états quantiques a énergie élevée soit main- 
tenu dans les microsystémes oscillants (1) ; 

— à conserver la rigidité de la structure moléculaire pour main- 
tenir un temps de relaxation relativement long du réseau, par rap- 
port aux microsystémes oscillants ; ceci pour éviter la diffusion 
rapide à travers le réseau moléculaire de |’énergie emmagasinée 
dans les niveaux quantiques élevés ; 


(4) Un microsystème est constitué, dans ce cas, par l’ensemble d’atomes des rési- 
dus aminés de l'ADN, caractérisés par. des transitions oscillantes entre deux ou plu- 


sieurs états stationnaires. 
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Amplitude 


transition 


Fic. 2. — Forme du signal codé. 


@,, période de répétition du régime oscillant global ; 
6,;, durée d’une transition probable d'indice 7; 
Y;, fréquence d’oscillation des photons pendant 0,. 


I 
0; min > aS et 0; max < On 
7 


La forme de l’enveloppe a été choisie arbitrairement. 


— à maintenir un temps de relaxation « transversale » convenable 
entre un microsystéme oscillant donné et les microsystèmes voi- 
sins ; ceci pour assurer une phase correcte dans l'interaction entre 
le champ électromagnétique et les divers microsystèmes oscillants 
et conserver ainsi une loi cohérente dans les messages. 


d) Les enzymes jouent un rôle fondamental dans la biosynthèse ; 
ils sont en équilibre thermodynamique précaire et effectuent des 
réactions chimiques réversibles. En captant un message sous forme 
de photons (venant soit des ADN, des ARN ou des protéines), en 
résonance avec leurs transitions quantiques et avec leur structure 
ordonnée, les enzymes fournissent au premier stade de la catalyse 
une énergie d'activation égale à celle des photons reçus (1). Les 
enzymes récupèrent cette énergie à la fin du cycle, au détriment 
du produit de catalyse et retrouvent leur état initial en expulsant 
des photons d'énergie équivalente. Il peuvent recommencer ainsi 
un nouveau cycle dans le cadre de la biosynthèse des acides nuclé- 
iques et des protéines. 


e) Les membranes du noyau et du cytoplasme jouent, entre autres, 
le rôle de filtres d’aiguillage d’information et de protection de la 
cellule contre la pénétration des radiations, des substances ou des 


() Suivant l'énergie des photons, l’enzyme exécute des rotations ou des vibrations 
intramoléculaires ou effectue la rupture des valences. Ces faits sont capables de 
déclencher l’autocatalyse spécifique qui se déroule et se trouve inhibée, à la fin du 
cycle, grâce à des phénomènes de contre-réaction. 


FONCTIONNEMENT DES CELLULES VIVANTES 81 


corps biologiques nocifs à la vie de la cellule. La double couche 
électronique qui entoure la membrane externe de la cellule vivante 
fait penser a une véritable cage de Faraday. 

La biosynthése, la mitose, les mutations, le rapport entre le vi- 
rus et la cellule-hôte, etc. peuvent trouver suivant cette hypothèse 
une interprétation cohérente. 

Il en est de même de certains aspects pathologiques de la bio- 
synthése ou de la mitose (chap. III). 


4. JUSTIFICATION DE L’HYPOTHESE 


Cette justification est faite en trois étapes : 


a) En établissant les conditions physiques générales nécessaires 
a la transformation d’un systéme passif en oscillateur sans tenir 
compte de la mécanique quantique. 


b) En introdmsant dans les conditions physiques générales les 
notions de la mécanique quantique, seules valables à 1’échelle 
moléculaire, échelle de la biologie cellulaire. 


c) En montrant par une analyse qualitative que certaines macro- 
molécules, et en particulier celles des acides nucléiques et des pro- 
téines, sont aptes à fonctionner les permières comme générateurs 
ou amplificateurs sélectifs d’information, les secondes comme effec- 
teurs spécifiques. 


Les idées émises au cours de la justification physique pour- 
raient se résumer comme suit : 


x) Dans la première étape, on montre qu'un excès d’entropie né- 
gative (la néguentropie de Brillouin) par rapport a l’entropie posi- 
tive dans un système (1), crée un équilibre thermodynamique pré- 
caire qui, dans certaines conditions structurales, est capable de 
transformer le système passif en source d’information. 

La modulation cohérente en fonction du temps du signal oscil- 
lant caractérise la quantité d’information du générateur. Par contre, 
les fluctuations statistiques (capables de brouiller l’action du signal 
cohérent) représentent une information négative dénommée dans 
cette étude la néguinformation (par analogie avec la néguentropie 
utilisée par Brillouin pour désigner une entropie négative). On y 
démontre qu’il existe deux conditions à l’amorçage d’oscillations, 


G) Systèmes se trouvant à la limite des conditions imposées par le deuxième 
postulat généralisé de Carnot. 
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dont l’une est d’ordre thermodynamique et l’autre d’ordre struc- 
tural. | 

L'entretien d’oscillations du générateur d’information exige | 
présence d’une source d’entropie négative extérieure au système 
oscillant et reliée à l’entrée de celui-ci. 


Nota. — Dans ce chapitre nous nous sommes appuyés en parti- 
culier sur les travaux de Brillouin se rapportant à la théorie de l'in- 
formation. 


6) Dans la deuxième étape, on introduit dans les conditions d’amor- 
cage et d’entretien d’oscillations les lois imposées par la mécanique 
quantique et en particulier : 


1° la quantification des niveaux d’énergie du système ; 
2° les lois d’interaction existant entre un champ électromagné- 
tique et les microsystémes oscillant entre des états stationnaires. 


On connaît actuellement un certain nombre d’oscillateurs et 
d’amplificateurs moléculaires dénommés « masers » fonctionnant 
sous l'effet d’un champ électrique ou d’un champ magnétique ex- 
térieur ayant des caractéristiques convenables. 

Sous l'effet de ce champ, on provoque dans un certain nombre de 
microsystèmes (molécules de NH, ou certains cristaux paramagné- 
tiques) un surpeuplement des niveaux quantiques à énergie éle- 
vée par rapport à l’état d'équilibre thermodynamique statistique. 

En réalisant des conditions convenables dans l'interaction entre 
un champ électromagnétique présent et les microsystèmes, on ob- 
tient un amplificateur ou un oscillateur hyperfréquences suivant 
le taux de surpeuplement des niveaux quantiques à énergie élevée. 

Dans le cas de « masers », la néguentropie d’amorcage et d’en- 
tretien d’oscillations est fournie aux molécules oscillantes par le 
champ électrique ou par le champ magnétique d’origine externe. 


y) Dans la troisième étape, on montre que certaines macromolé- 
cules biologiques, et en particulier les acides nucléiques, pourraient 
satisfaire éventuellement à toutes les conditions imposées à des 
oscillateurs moléculaires (1). En effet (fig. 3) : 


1°) Les ADN sont capables d’emmagasiner une énergie importante, 
qui pourrait provoquer des contraintes internes, caractérisées par 


(*) Le choix du terme polymaser pour l’oscillateur ADN, n'implique pas obliga- 
toirement que le mode d’oscillation est l’un des modes d’oscillation connus du maser. 
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un surpeuplement des niveaux quantiques à énergie élevée, et en 
particulier dans le cadre de la mésomérie des bases aminées (1) 


ponts hydrogène 


34 À 
71 


P P 
à By 
SS ee 
: NS pe : 
D S—G..C—S À 
P P 
ae oc...” 
hélice « hélice Y 
<== 20 AS 
Fic. 3. — Structure de l'ADN suivant Warson et CRICK. 
P, phosphates ; 
S, sucre pentose ; 
A, adénine | ya eee J 
G, guanine 2 ge 
T, thymine | ee 
C, cytosine | bases pyrimidiques. 
Nota. — La forme hélicoïdale de la molécule se prête particulièrement au rayon- 


nement des ondes électromagnétiques dans une bande de fréquences relativement 
large. Les lignes en pointillés représentent suivant l’hypothése le mode de propaga- 
tion de l’onde électromagnétique a travers la molécule ; les transitions oscillantes 
sont supposées dans les bases aminées. 


(1) Il est connu, en effet, que les molécules douées de nombreux états de résonance 
sont aptes 4 emmagasiner une énergie importante. 
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20) Leur structure moléculaire est très rigide. Ils forment, en 
effet, des polymères longs, enroulés sous forme d’hélices, comportant 
de nombreuses branches latérales avec des bases aminées isolées 
de part et d’autre par des sucres pauvres en liaisons conjugées. Ces 
facteurs favorisent un temps de relaxation long entre le réseau mo- 
léculaire et les microsystèmes oscillants. 

De plus, cette rigidité structurale réduit considérablement les 
possibilités de transformations internes de la molécule. 

Toutes ces caractéristiques correspondent à une entropie néga- 
tive élevée des acides nucléiques. 

3°) Leur structure chimique comporte des séquences ordonnées 
de bases aminées susceptibles de former un véritable code dans les 
échanges entre sources d'informations et effecteurs (les protéines, 
en l’occurrence). 

4°) Les liaisons conjuguées dans les phosphates, des acides nuclé- 
iques, permettent de réaliser une transmission rapide d’un effet 
inductif à travers un ADN. L’amorçage en chaîne d’oscillations a 
travers les microsystèmes de la molécule (les bases animées des 
ADN en l'occurrence) pourrait ainsi faire son apparition. 


5°) A la température normale, la répartition spectrale due à l’agi- 
tation thermique ne comporte que des fréquences inférieures à 
60-10 *o/svenviron (=. 2041): 

L’énergie emmagasinée dans les états excités des acides ou des 
bases aminés étant supérieure a celle correspondant à À = 20 yp, 
Ventropie positive d’information ou la néguinformation de ces 
molécules est donc négligeable, pour les bandes spectrales dans 
l'infrarouge (A > 10), dans le visible et dans l’ultraviolet. Toutes 
ces considérations nous conduisent aux conclusions suivantes : 


— Les acides nucléiques (les ADN en partictlier, et les ARN dans 
certaines conditions) auraient tendance à fonctionner ou à se trans- 
former en sources d'informations, par déclenchement en chaîne 
d’oscillations codées. En expulsant une certaine quantité d'énergie 
sous forme de photons, ces molécules augmentent leur entropie 
positive et pourraient, de ce fait, se conformer au deuxième postulat 
de Carnot. 


— Les bandes spectrales d'émissions cohérentes seraient situées 
essentiellement dans l’infrarouge entre x et 10 uw (accompagnées de 
raies fines sur des longueurs d’onde plus élevées) avec certaines 
bandes dans l’ultraviolet autour de 2.560 A essentiellement. Les 
photons dans l’infrarouge serviraient à effectuer des rotations mo- 
léculaires et la rupture des valences faibles (ponts hydrogène ou 
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métalliques), tandis que les photons dans l’ultraviolet pourraient 
rompre des valences normales de 100 kcal /mole environ. 


Information 


Fic. 4 


Grâce au signal de haute spécificité et à grande redondance, en 
accord avec le principe de Dancoff (1), les acides nucléiques seraient 
capables d’asservir des systèmes extérieurs pour leur faire exécuter 
un programme complexe et précis, en mettant en jeu une énergie 
de commande très faible. 

L'action d’asservissement de la source est d'autant plus efficace 
que les systèmes extérieurs, amplificateurs et effecteurs, sont, par 
leur structure quantifiée et cohérente, en résonance avec elle (?) et 
que leur facteur de bruit est plus faible ; ce serait le cas des ARN et 
des protéines biologiques par rapport aux ADN. 


5. CONCLUSIONS 


a) En assimilant la cellule vivante à un système microcyber- 
nétique électromagnétique et quantique, un grand nombre de phé- 
nomènes biologiques observés dans la vie cellulaire peuvent trou- 
ver une interprétation cohérente. 

La terminologie actuelle en biologie, de résonance, de sélectivité, 
et de code retrouverait ainsi un sens physique précis. 


(1) Postulant que la cellule adopte le compromis le plus avantageux entre la quan- 
tité d’information et le taux de redondance pour ramener la probabilité d'erreur 
dans la biosynthèse à des valeurs admissibles pour la vie cellulaire. 

(2) Mémes spectres d'émission et d'absorption avec les mêmes périodes de répé- 


tition. 
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b) Suivant l'hypothèse émise, la frontière physique entre l’inerte 
et le vivant pourrait résider dans la transformation de certaines 
macromolécules passives en sources d’information codées capables 
d’asservir d’autres systèmes; le cas du virus pourrait servir d’ex- 
emple. 


c) La vie, sous son aspect physique, serait entièrement dominée 
par des phénomènes de résonances électromagnétiques régis par la 
mécanique quantique ; elle ne serait possible que grâce à la dis- 
continuité de l'énergie et de la matière, ainsi qu’au degré élevé d’or- 
ganisation de celle-ci dans les macromolécules biologiques. Ce der- 
nier aspect pourrait fournir la clef de la relation existant entre l’in- 
formation et l’entropie négative dans un système vivant. En effet, 
selon notre hypothèse, l'entretien de la vie cellulaire serait carac- 
térisé par le cycle (fig. 4). 

Ce cycle n’est pas réversible ; une source extérieure doit compen- 
ser les pertes en entropie négative dans la cellule. 


d) La stabilité des caractéristiques des sources d’information, la 
sensibilité et la fidélité des effecteurs, atteignent dans les cellules 
les limites permises par les lois de la physique moderne. 

Ces propriétés pourraient s'expliquer par le fait que les bandes 
spectrales des photons émis par les sources d’information biologi- 
ques seraient situées essentiellement dans l’infrarouge (10 > À > 
1x), dans le visible et dans l’ultraviolet autour de 2.560 A, c’est- 
a-dire en dehors du spectre de rayonnement des corps noirs (a la 
température normale, ce spectre se trouve à À > 20 pz). Les émis- 
sions cohérentes des photons ne seraient pas perturbées ainsi par 
le « bruit » ou par la néguinformation et quelques photons sont sou- 
vent suffisants pour fournir une information valable. 

Les deux relations d’incertitude de Heisenberg et de la thermody- 
namique quantique (faisant intervenir les constantes de Planck 
et de Boltzmann) se situeraient aux frontiéres de la biologie. 

Ce dernier aspect du probleme va sans doute présenter des di- 
difficultés d’ordre majeur auxquelles devra faire face la biophy- 
sique expérimentale. 


e) La physique biologique sera l’œuvre des 30 prochaines années ; 
elle sera probablement une synthése des champs électromagnéti- 
ques et de l'information dans le cadre de la cybernétique quantique. 

Un tel champ d’information pourrait présenter des propriétés 
particulières susceptibles de jeter une certaine lumière sur la faculté 
d'un organisme vivant de maintenir son organisation spécifique. 
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f) Comment vérifier expérimentalement la validité de Vhypo- 
these .? 

Le chapitre V comporte un certain nombre de suggestions. Il s’a- 
git, en particulier, d'étudier la capacité d'émissions électromagné- 
tiques dans les acides nucléiques et la capacité d’effecteurs spéci- 
fiques des protéines sous l’effet des photons dans les spectres in- 
frarouges et ultraviolets modulés suivant un code à déterminer. 

L'ingémiosité des biochimistes et des biophysiciens permettra 
sans doute d'imaginer des méthodes expérimentales au fur et à 
mesure que les physiciens mettront à leur disposition des appareils 
capables de produire des émissions cohérentes dans les spectres 
infrarouges, visibles et ultraviolets, et de capter de telles émissions 
à très faible puissance. 

C’est probablement vers des macromolécules biologiques qu’on 
se tournera pour réaliser de tels appareils ; la voie vers la synthèse 
de la cellule pourra, éventuellement, se trouver ainsi ouverte. 


III. INTERPRÉTATION D'UN CERTAIN NOMBRE 
DE PHÉNOMÈNES BIOLOGIQUES DANS LA CELLULE 
A LA LUMIERE DE L’HYPOTHESE EMISE 


1. RAPPEL DE QUELQUES CARACTÉRISTIQUES BIOLOGIQUES DE LA 
CELLULE VIVANTE 


La cellule forme l'unité indivisible dans un organisme vivant 
quelle que soit la complexité de celui-ci. 

La cellule se présente comme un système hétérogène, organisé, 
en équilibre dynamique interne et externe et capable de mainte- 
nir et de reproduire son organisation dans un milieu non vivant. 
Elle est caractérisée par la reproduction, le métabolisme et l’exci- 
tabilité. 

On distingue dans la cellule le noyau et le cytoplasme. 

Dans le noyau, on trouve essentiellement les chromosomes, sous 
forme de bâtonnets dont le nombre est caractéristique pour chaque 
espèce -(dans les gamètes, le nombre de chromosomes est réduit de 
moitié). Chaque chromosome est composé de centaines de groupe- 
ments de gènes différents et disposés en chaînes. Les gènes occu- 
pent une place bien définie dans le chromosome auquel ils donnent 
sa structure déterminée et son caractère spécifique. 

Les gènes représentent les éléments les plus stables de la cellule 
et sont porteurs de l’hérédité de l'espèce. Ils sont susceptibles de 


mutations. 
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Le noyau est entouré par un cytoplasme qui comporte de nom- 
breux organites tels que les mitochondrites, les centrioles, etc. ; 
chacun de ces organites comprend des enzymes. 

Le noyau d’une part et le cytoplasme d’autre part baignent dans 
des solutions à l’état colloidal et sont délimités par des membranes 
ayant des propritétés sélectives d’csmose. 

Parmi les phénoménes principaux d’ordre biologique affectant 
Ja vie de la cellule, on peut citer : 


--- l'entretien de la vie cellulaire ; 

— la biosynthèse et la division cellulaire ; 

—-les effets anormaux et pathologiques de la biosynthèse et en 
particulier les mutations, le « cancer » et les rapports entre le virus 
de la cellule-hôte ; 

— J'adaptation de la cellule aux variations des facteurs extérieurs. 


Nous allons proceder a une inteiprétation schématisée de ces 
divers phénomènes à la lumière de l’hypothèse émise assimilant la 
cellule à un système cybernétique quantifié. 


2. L'ENTRETIEN DE LA VIE CELLULAIRE ET LE RÔLE DES PROTÉINES 


a) Généralités. — Nous rappelons que suivant l'hypothèse ex- 
posée dans le résumé, les principaux constituants de la cellule ont 
les rôles suivants : 


— les ADN des gènes fonctionnent comme sources primaires 
d'informations quantifiées ; 

— les ARN et les protéines, sous l'effet des ADN, fonctionnent 
comme sources secondaires ; 

— les protéines ont par ailleurs un role a’ effecteurs spécifiques. 


Le rôle d'alimentation en néguentropie des ADN et des ARN est 
assuré par les protéines fortement couplées aux acides nucléiques 
et formant avec eux des nucléoprotéines DNP et RNP. 

Pour entretenir en permanence le régime d’oscillations spécifi- 
ques codées, les protiénes doivent maintenir intacte la structure 
chimique des acides nucléiques malgré l'émission des photons par 
ceux-Ci. 

Si l’on se reporte à la figure 2 (signal émis par les ADN), chaque 
rectangle représente un « message » d’une durée quantifiée 0, d’émis- 
sion d’un certain nombre de photons à la fréquence v 


mn. * 
t 
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ME: EN We: 
ve ULST PRES (1) 


W m, et W,, représentent deux états stationnaires entre lesquels 
oscille l'énergie de la transition : ; 

h, constante de Planck ; 

6,, période de répétition du régime oscillant global ; 

9, durée d’un message d’indice 7 comprenant ; photons de fré- 
quence ‘4,4: 


Conformément a la théorie de Vinformation, on a les relations 
suivantes : | 


Quantité d’information : 
s 
q,= D p, log: p: [bits] () (2) 
i 


Énergie contenue dans |’information : 


W, > 10769, [ergs /degré ] (?) (3) 


Débit d’information : 


C= . (bits /s) (4) 


Les messages étant identiques à chaque période de répétition, la 
redondance de l'information est voisine de l’unité. La variété des 
bases aminées (quatre types principaux) et d’acides aminés (vingt 
types environ), ainsi que la différence dans leur enchaînement res- 
pectii, représente la richesse de l'information contenue dans les 
molécules biologiques. La redondance élevée de l’information amé- 
liore sensiblement la précision dans l'exécution des commandes. 


b) Fonctionnement des protéines comme effecteurs spécifiques 


(1) Cas où les probabilités sont différentes pour les S messages Cents ; la quan- 
tité d’information d’après SHANNON est donnée par l'équation (2) : 

s, nombre de messages ; 

p:, probabilité correspondant au message 2. 

(2) Un bit d’information exige une dépense de 1071 ergs/ degré d’entropie 
négative dans une transformation réversible. 
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dans l'entretien d'oscillations des acides nucléiques. — Pour accom- 
plir leur rôle les protéines assurent l’alimentation en néguentropie 
quantifiée des ADN et des ARN suivant le schéma ci-après, en 
libérant l'énergie contenue dans des dérivés phosphorylés amenés 
de l'extérieur. 

Les protéines étant dans un état d'équilibre thermodynamique 
instable ne peuvent qu’exécuter des cycles réversibles. En captant 
dés photons émis par les ADN ou par les ARN en résonance avec 
leur structure, elles exécutent un travail capable de fournir une éner- 
gie d'activation nécessaire à l’hydrolyse des phosphates. A la fin 
du cycle, les protéines récupèrent l’énergie d’origine au détriment 
du produit de catalyse et en expulsant des photons d'énergie équi- 
valente, elles retrouvent leur état initial et peuvent recommencer 
un nouveau cycle de catalyse. 

Les photons libérés par les protéines peuvent servir comme source 
d’information aux enzymes dans leur travail de biosynthése de ces 
mêmes protéines. 

L'énergie libérée par l’hydrolyse des phosphates au cours de la cata- 
lyse sert comme néguentropie d'alimentation aux ADN et aux ARN. 

En résumé, les protéines joueraient dans le cadre de l'entretien 
de la vie cellulaire un rôle analogue à celui de l’alimentation élec- 
trique régulée dans le montage d’un oscillateur ou d’un amplifica- 
teur électronique classique, la source d’énergie étant fournie par 
les dérivés phosphorylés (fig. 5). 


Oscillateur : 
A aes : Alimentation Source 
mplificateur autoréquiée d'énergie 
Dechet 


a Photons 


TL 


Frotéine 


Néguentropie 


ARN Substances 
phosphatées 
L_iaformation ___; 
(photons) 
Fic. 5. — Schéma fonctionnel de l’entretien de la vie cellulaire. 


3. LA BIOSYNTHESE ET LE ROLE DES ENZYMES 


La figure 6 représente d’une facon schématique la biosynthèse. 
Les énergies d’information y circulent suivant les pointillés tan- 
dis que le sens de la matière est figuré en traits pleins. 
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-AN’ 
——— Sens des informations{photons) —«— Sens de /2 matière 


Fic. 6 (1). — Schéma de la biosynthèse. 


1. Z ADN ; 2.2 ARN; 3. & Prot. DNP ; 4. & Prot. RNP ; 5. Z ADN synthétisés ; 
6. 2 ARN synthétisés ; d. déchets ; e, enzymes spécifiques ; J- AN, substances avec 
néguentropie enrichie ; —AN a Substances avec néguentropie diminuée ; S, substrats; 
P, photons. 


Il est établi que le rôle des enzymes dans la biosynthèse est fon- 
damental. Les enzymes sont des macromolécules en équilibre ins- 
table et ne peuvent subir que des réactions réversibles. S'ils captent 
une énergie sous forme de photons, ils sont obligés de la perdre 
en accomplissant un travail (en expulsant, par exemple, des élec- 
trons d’énergie équivalente ou en exécutant des rotations ou des 
vibrations moléculaires). 

La condition de réversibilité exige que la relation 

1 DW mn, Cn p, 


Ct re een. Gls 


r TT 


(4) La biosynthése des protéines n’a pas été figurée pour ne pas compliquer davan- 
tage le schéma. Les ADN fourniraient directement aux enzymes seulement l’infor- 
mation spécifique non contenue dans les ARN. 

Tl est à signaler que dans certains cas, des enzymes peuvent exécuter leur rôle 
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soit satisfaite (en vertu des lois de la mécanique ondulatoire). 


h, constante de Planck ; | 

Vmny fréquence d’oscillation des photons du message 1 ; . 

Pa quantité de mouvement de l’électron exécutant le travail, 
sous l'effet du message : ; 

ve vitesse de l’électron ; 

C, vitesse de la lumière ; 

Ni; nombre de photons émis au cours du message 7 ; 


AW, représente l’énergie des photons captés par l’enzyme ou l’éner- 
gie perdue par l’enzyme sous forme de travail ou de né- 
guentropie par seconde. 


L'énergie totale par seconde (1) 
Mos ie eS ni, ps 
ar LD 22 


L’enzyme aura fourni ainsi au premier stade de la catalyse une 
énergie d'activation AW, par seconde en cédant par exemple au 
substrat des électrons. Il récupère ceux-ci à la fin du cycle au dé- 
triment du produit de catalyse et retrouve son état quantique d’ori- 
gine en émettant des photons d'énergie équivalente. L’enzyme peut 
recommencer un nouveau cycle de catalyse sous l’effet de photons 
captés. 

Le travail exécuté par les enzymes ne peut pas être imprécis puis- 
que tous les échanges énergétiques entre la source d’information, 
l’effecteur et le substrat sont spécifiques et quantifiés avec effet 
d’autocatalyse par contre-réaction. Le substrat aura subi ainsi en 
cascade une série d'opérations chimiques grâce à l’intervention des 
divers enzymes. 

Ce schéma présente une certaine analogie avec le déroulement 
d'un programme dans une usine entièrement automatique. 

A la fin de chaque cycle, le produit se trouve divisé en deux parties: 
la première à néguentropie enrichie sert à la biosynthèse, la seconde 
à néguentropie diminuée est éliminée comme déchet ou peut éven- 


catalytique en l'absence de ADN ; les molécules biologiques disposeraient d’une 
«mémoire », c’est-à-dire qu’elles seraient susc eptibles de « garder » des états quan- 
tiques excités pendant un certain temps après l'excitation. 

(1) S, nombre de messages par ADN et M, nombre de ADN dans la cellule >; 0rB 
période de répétition pour un ADN d’incide B. 
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tuellement servir comme substrat à une nouvelle ponction de né- 
guentropie. 

Au terme de ces nombreux cycles, on aura synthétisé soit un ADN, 
soit un ARN, soit une des protéines suivant que «la chaîne de fa- 
brication » a été programmée par les photons venant de l'ADN, de 
l'ARN ou des protéines. 


On voit ainsi que le modèle de fabrication ou le moule est fourni par 
l’ensemble d'informations hautement spécifiques et quantifiées des 
photons émis par les ADN, les ARN et les protéines (y compris les 
enzymes), l'ADN ayant en général le rôle inducteur par excellence. 


4. LA MITOSE 


Le phénomène de la division cellulaire pourrait s'expliquer par 
le fait que la biosynthèse amène dans le noyau cellulaire des macro- 
molécules chimiquement identiques aux chromosomes. 

A partir de ce moment, interviendrait le phénomène connu de 
synchronisation entre un système passif et un système actif, iden- 
tiques, couplés entre eux. 

La présence de ces deux émetteurs fortement couplés, crée un état 
d'équilibre thermodynamique favorisant la délocalisation maximum 
de ces générateurs; il y a rupture des ponts H avec échange de leurs 
hélices. 

On assiste ainsi aux différentes phases de la mitose : séparation 
des chromosomes en deux groupes, se repoussant vers les extrémi- 
tés opposées du noyau pour aboutir à la formation de deux noyaux 
et de deux cytoplasmes et, enfin, de deux cellules identiques à la 
cellule mère. 

Si le rythme du renouvellement cellulaire est plus rapide que ce- 
lui de la destruction, on assiste à un processus de croissance. 


Nota. — Les centrioles et les corps de Golgi semblent jouer un 
rôle important au cours de la mitose ; ce rôle paraît pour le moment 
assez obscur. 


5. LA MUTATION DES GÈNES ET LES TROUBLES DE LA BIOSYNTHÈSE 


Un changement intervenu dans un certain nombre d'états quan- 
tiques des ADN ou des ARN, entraînant la modification de la 
structure spécifique de l'information (avec une perte inapprécia- 
ble ou avec un gain du degré d’organisation cellulaire) sous l'effet 
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des radiations ou des substances chimiques, pourrait donner lieu a 
des mutations. 

Si, par contre, la modification d’états quantiques touche des ADN, 
des ARN ou des protéines, avec perte appréciable de l’organisation 
cellulairé, on pourrait assister à des troubles pouvant entraîner une 
baisse de différenciation dans le cadre de la biosynthèse avec effet 
récurrent, entraînant la dégradation de la vie cellulaire. Ce tableau 
rappelle celui qu’on se fait du « cancer » (1). 

Dans certaines conditions, on pourrait assister à un « accident » 
entraînant l’arrêt d’oscillations d’un ADN. 

Dans ces conditions, la biosynthèse se trouve perturbée par le 
manque de ces informations spécifiques, et peut entraîner à bref 
délai la formation des cellules dans lesquelles deux ou plusieurs 
gènes cesseraient de fonctionner, puisqu'il est établi que certains 
enzymes sont commandés par plusieurs gènes à la fois. 


6. DÉFENSE REMARQUABLE DE LA CELLULE VIVANTE CONTRE LA 
VARIATION DES FACTEURS EXTÉRIEURS 


Tout générateur d’information est par définition un système non 
linéaire. Si toutes les conditions d’entretien sont remplies avec une 
certaine marge de sécurité, le générateur comporte une plage plus 
ou moins grande d'équilibre en fonction des variations de facteurs 
extérieurs (température, pression, etc.). Le rythme de la vie de la 
cellule s’adapte aux conditions extérieures : si celles-ci sont défavo- 
rables, la cellule tend vers « l’hibernation » ; par contre si elles sont 
favorables et si la néguentropie d’alimentation est supérieure a celle 
dépensée par la cellule, celle-ci peut évoluer vers des formes plus 
organisées, c’est-à-dire vers des organismes supérieurs. 


7. LA MÉMOIRE 


Si les conditions de métabolisme dans un organisme supérieur 
sont particulièrement favorables, l’excés de néguentropie fournie 
à celui-ci (au-delà de sa possibilité de croissance et de stockage en 
produits consommables) pourrait éventuellement être converti en 
mémoire, c’est-à-dire dans une «mise en réserve » d’une certaine 
quantité d’information. Ce rôle serait dévolu à des cellules spécia- 
lisées à cet effet, capables de conserver longtemps des états quan- 
tiques excités. 


() Une deuxième hypothèse pour expliquer le phénomène du «cancer» est exposée 
sous le N° 8, en rapport avec le virus. 


FONCTIONNEMENT DES CELLULES VIVANTES 95 


Nota. — Ce phénomène pourrait ouvrir des perspectives intéres- 
santes sur l'étude de la formation des cellules spécialisées supports 
de la mémoire (par exemple des cellules du cerveau). 


8. LE VIRUS ET LA CELLULE-HÔTE 


La première condition thermodynamique d’entretien d’oscii- 
lations pourrait donner éventuellement la clef de la différence 
fondamentale dans le comportement du virus à l’intérieur et à 
l'extérieur de la matière vivante. On sait en effet que le virus du 
point de vue chimique (a l’état cristallisé) ressemble beaucoup 
soit aux DNP du noyau cellulaire soit aux RNP du cytoplasme. 

Les molécules chimiques isolées à partir du virus (les ADN ou les 
ARN) (1) pourraient satisfaire à toutes les conditions d’oscillateurs, 
sauf a la condition d’alimentation, le virus ne comportant pas 
d’activité métabolique. Ce n’est que placé dans un milieu vivant, a 
néguentropie élevée, doué de métabolisme, que le virus pourrait 
trouver sa source extérieure de néguentropie. L’effet inductif de 
VARN peut déclencher alors le régime d’oscillations qui lui est pro- 
pre pour manifester sa « vitalité » et subjuguer le système enzyma- 
tique de la cellule a son activité spécifique, c’est-à-dire à la reproduc- 
tion de l ARN et de la protéine du virus. 

L’activité du virus pourrait étre favorisée par rapport a celle des 
gènes de la cellule-hôte par le fait que le virus, placé dans le cyto- 
plasme, serait plus prés des enzymes que ne le sont les ADN du 
noyau. De plus les ARN du cytoplasme (plus semblables chimique- 
ment aux acides nucléiques de certains virus qu’aux ADN du noyau) 
auraient plus tendance a obéir aux photons émis par le virus qu’a 
ceux émis par les ADN du noyau. 

Il n’est pas exclu par ailleurs, que dans certaines conditions, un 
ARN normal du cytoplasme puisse se transformer en source pri- 
maire «autonome » pour donner un «virus» sur la base de l’en- 
dogenése. Cette éventualité cadrerait avec de nombreuses expéri- 
ences et en particulier avec les observations faites au microscope 

électronique sur des cellules cancéreuses. Les deux hypothéses sur 
l’origine du cancer (voir p. 93 N° 5) sont peut-être valables et nous 
assistons parfois à un cancer ayant son origine dans une modification 
de l'information spécifique du circuit de métabolisme et parfois à 


(1) Des expériences récentes sur le virus permettent de conclure que, après péné- 
tration dans la cellule, le virus se débarrasse de sa protéine. Son ARN ou son ADN 
seul subjugue le métabolisme de la cellule à la reproduction du virus. 
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un cancer ayant l’aspect viral sur la base d’endogenése (malfor- 
mation de certains ARN). Dans les deux cas, la cellule perd son 
haut degré d’organisation et de différenciation. 

Même si l’effet immédiat d’un phénomène parasite dans la bio- 
synthèse est relativement réduit, les conséquences à plus long terme 
peuvent être importantes, étant donné que toutes les opérations de 
la biosynthèse et de l'entretien de la vie s'effectuent par de multi- 
ples boucles de réaction. Ainsi, de petites causes peuvent provoquer 
à longue échéance de grands effets dans la vie cellulaire. 


9. CONCLUSIONS 


a) Le modèle cybernétique de la figure 1 que nous avons adopté 
dans cette étude semble permettre une interpétation cohérente de 
nombreux faits biologiques touchant la vie cellulaire. 

Notre compétence limitée dans ce domaine ne nous permet que 
d'exprimer le souhait que des spécialistes en la matière apportent 
les corrections nécessaires au tableau brossé au cours de ce chapitre 
et confrontent par ailleurs d’autres faits biologiques ou biochimi- 
ques avec l'hypothèse en question. 


b) Les bandes spectrales cohérentes des photons émis par les sources 
et reçus par les effecteurs biologiques seraient situées essentielle- 
ment dans l’infrarouge (entre I et 10 y environ), le visible et l’ultra- 
violet (entre 2.500 et 4.000 A environ) (1). Des photons dont l’éner- 
gie serait < 30  joueraient un rôle secondaire. 

Les rayons X et y dans les cellules seraient uniquement d’origine 
externe et seraient la cause des troubles ou des lésions dont nous 
connaissons les conséquences néfastes sauf dans la lutte contre des 
cellules parasites. 

Les cellules sensibles à la lumière (cônes et bâtonnets de la ré- 
tine) ou aux rayons calorifiques présenteraient respectivement 
une grande sélectivité dans les spectres visibles et infrarouges (leurs 
transitions oscillantes seraient essentiellement situées dans ces deux 
bandes spectrales), et ces cellules se comporteraient comme des 
effecteurs spécifiques. La photosynthèse dans le monde végétal se 
présenterait sous un aspect analogue. 


c) Dans les applications devenues classiques de la cybernétique à 
la physiologie d'organismes supérieurs, les phénomènes électriques 
pris en considération sont à l’échelle du macrocosme. 


(1) Correspondant aux spectres d'absorption des acides et des bases aminés. 
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De nombreux simulateurs ont été réalisés en laboratoire, dont le 
célèbre homéostat d’Ashby et la tortue électronique de G. Walter. 
Il faudrait à notre avis, qu’à l'avenir, un pont soit jeté entre la 
cybernétique classique et la cybernétique quantique, de manière 
que les références internes (les sources d'informations d’origine 
interne) et le degré de leur hiérarchisation dans les fonctions physio- 
logiques d’un organisme puissent englober les phénomènes à l'échelle 
cellulaire. 


(à suivre) 


CYBERNETICA (Namur) 
Vol II — N°2 — 1959 


The automatic control 
of production processes 


by R. C. BREWER, 


Imperial College of Science and Technology 
(University of London) 


INTRODUCTION 


For many years, there has been a general trend towards more 
automatic working and slow but definite progress has been made 
to the present state of advanced mechanisation, culminating in the 
transfer line. It is now conceded by many people that it would 
have been more fortunate had the word mechanisation (or advan- 
ced mechanisation) been applied to this trend, rather than the word 
automation. The trend mentioned was limited to the mechanisa- 
tion of some function which had previously been performed manual- 
ly by an operator ; a typical example is the centre lathe which, 
with the advent of turret tooling etc., eliminated much of the hand 
changing of tools that had been common previously ; the introduc- 
tion of the automatic screwing machine completely mechanised 
all functions except for the feeding of bar stock when the exis- 
ting supply ran out ; this mechanisation was accomplished by cam 
control of the various cross slides and, in the case of the turret type 
automatic, by cam control of the hexagon turret also. From a cy- 
bernetic point of view the chief limitation of this kind of mechani- 
sation is the fact that the machine or process can do no more than 
is built into it ; for example, the automatic screwing machine can- 
not perform a slotting operation if no slotting attachment had been 
built into the machine ; even more seriously it can do nothing 
to control the production process if for any reason bad work is pro- 
duced, e.g. if the rate of tool wear is considerably higher than ex- 
pected and over-sized diameters are being produced. Gauge con- 
trol could be fitted, but this would only enable the process to stop 
itself ; it would not enable corrective measures to be taken. It 
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thus became evident that some new approach to automatic wor- 
king was required, an approach in which some simulation of the 
human brain was added to the simulation of manual techniques. 

The type of mechanisation referred to also had certain economic 
disadvantages. The control of the process was always derived from 
special guides or attachments, or some means of master profile or 
cam ; special guides and attachments add to the cost of the machine 
and cams and master profiles have to be manufactured and repre- 
sent many hundreds of hours of work and a considerable initial 
cost. Either way there is an increased cost and this has to be shared 
between all the components. In order to bring this cost down, on 
a unit basis, to something reasonable, a very large number of com- 
ponents has to be produced. This in itself precludes the use of this 
form of automatic control in batch production and any kind of pro- 
duction where frequent modifications are required, such as deve- 
lopment work. 

The first automatic development which showed some promise 
in small number production was in the early post-war years and 
is now usually known as the play-back system of automatic pro- 
duction control. This system does not eliminate the skilled opera- 
tor ; he is still required and produces, carefully, one component ; 
during this cycle of events, the various motions involved in the 
process are recorded on a magnetic tape. This magnetic tape is then 
played back and is used to control motors which reduplicate, for 
the further components, the original motions of the operator. The 
advantages of this form of control are largely connected with the 
working of particular machine tools where movement from one 
point to another point is virtually the only thing which can be made 
automatic ; a typical example is the jig borer. Some advantage 
can be gained by the use of time magnification, i.e. the fact that the 
recording and playback speeds need not be the same ; this enables 
the process to proceed at a much faster rate than when the operator 
was in control. It will be apparent that this time magnification can- 
not be increased indefinitely and, in any event, we are still depen- 
_ dent upon the accuracy to which the human operator can work ; 
although this can be high in certain circumstances there are many 
fields in which human operation leaves very much to be desired, 
particularly any form of simultaneous working in three dimensions. 

The same kind of problem has been met previously, e.g. in the 
use of radar for gunnery control and the automatic control of che- 
mical processes. In both these cases one very severe limitation of 
the human operator is the normal response time of some third of 
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a second. In both these cases, the essence of the solution was the 
type of control using a feed back ot information. In the past two 
decades, considerable advances have been made in both theory 
and practice of servo mechanisms and consequently, some seven 
or eight years ago, when the initial idea of applying such princi- 
ples to production processes was considered, the state of knowledge 
and development of the control system was far in excess of the 
knowledge of how to apply it to the production process. Indeed, 
one of the main limitations, even today, on the accuracy which is 
attainable by automatic control methods, is the fact that the ma- 
chine or machine tool forms part of the general servo loop and in 
general has not a sufficiently high value of dynamic stiffness. 

In applying any form of automatic control to the production 
processes, it should be borne in mind that the problem is usually 
not one of maintaining some specific operation but is more complex, 
to the extent that the control system must be programmed automa- 
tically if full advantage is to be taken of this form of automatic 
working. 

Since the bulk of the control problem is simply that of controlling 
numerical quantities, this programming is largely a question of 
feeding the correct numerical information to the control system in 
a language which it can understand. The fundamental problem is 
probably epitomized by the machine tool, in which the paths to 
be taken by some moving member such as a tool or a table and the 
rate at which these paths are to be taken, are decided by the pro- 
duction engineer ; this information must then be converted into 
a suitable form ror feeding to the control system. The control system is 
error actuated and this means that there is always some error in 
the system ; it will, in general, be the aim of research and develop- 
ment engineers to reduce this error to a minimum, although for 
many applications, there is no great need for a highly accurate con- 
trol system. It is important that this point should be emphasised 
since there appears to be a trend to regard the most accurate con- 
trol system as being the best for all purposes. 


NUMERICAL CONTROL 


Figure 1 indicates the general elements of an automatic control 
system in which the information is essentially numerical. The nume- 
rical information must be converted into some physical form and, 
at the moment, it must be conceded that this physical form is almost 
essentially electrical. This requires some form of transfer medium 
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which may be temporary in nature, e.g. decade switches, telephone 
dial, etc. or permanent, e.g. punched or magnetic tape or punched 
cards. The control system then has to compare continuously, this 
commanded numerical information with the information fed back 
from the transducer whose function is to convert the current magni- 
tude of the quantity controlled into an electrical language ; often 
this language will be the same as the language of the command 
information, but in some circumstances this practice may have to 


| NUMERICAL INFORMATION | 


Ÿ 


| 
TRANSFER MEDIUM | 


Ÿ 


| DATA PROCESSING | 


Ÿ 


COMPARATOR 


| 


if ERROR SIGNAL 


SERVO-MOTOR 


Ÿ 


| MOVING ELEMENT | 


} 


| TRANSDUCER 


PIC seal. 


be varied ; in this case, some kind of converter will be required. For 
example, the command information may be in digital form and yet 
the transducer may be analogue ; in this case, a decision would have 
to be made as to the nature of the comparison (i.e. digital or ana- 
logue) and, this having been done, a digital to analogue converter 
would link the command information to the comparator or an ana- 
logue to digital converter would link the transducer to the compara- 
tor, as the case may be. 

_ The stages in the automatic control of a production process may 
now be considered in turn : 


a) The command information. 


After the design stage, the numerical information normally 
exists in the form of a co-ordinate engineering drawing. The first 
stage is the conversion of this information to co-ordinate tabular 
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form. This information has then to be supplied to the control sys- 
tem in electrical form via some transfer medium, permanent or 
temporary, as mentioned previously. The operator’s familiarity 
with the decimal system of counting and his complete lack of fa- 
miliarity, in general, with any other form of counting will usually 
limit the use of temporary storage media to decimal coding although 
a decimal-to-binary converter could be introduced. The permanent 
storage media, however, are considerably more versatile and, be- 
sides decimal coding, may employ some form of binary or decimal- 
binary coding. One obvious object is to convey the required infor- 
mation with the smallest number of holes but, in the interest of 
accuracy, it is essential to ensure that the reading of this informa- 
tion is not ambiguous. This consideration has led to the replacement 
in some systems, of the pure binary coding by some form of cyclic 
binary coding e.g. Gray. 

Psychology, however, continues to play a part even in this 
tendency to automatic production, e.g. some manufacturers using 
punched cards or punched tape prefer to use the decimal form of 
coding so that the operator can still read and understand the in- 
formation encoded. 

Apart from the numerical information which has to be conveyed 
to the control system, many instructions to the machine or machine 
tool have to be conveyed as functional commands ; for these, cer- 
tain permutations ot holes are used which have no numerical si- 
gnificance. The coding and punching is usually carried out by one 
of the standard coders such as teleprinter, flexowriter etc. 

This information is normally read by an electromechanical or 
optical tape reader ; the information may be read in block form, one 
block being either a digit, a co-ordinate or all the co-ordinates which 
specify some particular point. The very low inertia of the 
optical tape reader is assuming more importance as the trend towards 
higher operating speeds becomes more pronounced, the speed of the 
tape reader often being the limiting factor in controlling the process. 


b) Assimilation and processing of the numerical information. 


In the control of production processes, normally there are two 
different types of problem. In the first type, the moving element 
of the machine has merely to be moved from one specified position 
to another specified position, the intermediate path being quite 
immaterial. The other type of automatic control is that in which 
some specified path has to be followed and a continuous control 
has to be exerted on the moving element. 
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Evidently the first type of problem is much simpler from the 
data processing point of view although it has its own technologi- 
cal problems since, inevitably, the accuracy requirements are hig- 
her and stiction difficulties are met as the moving element slows 
down to its final position. 

The latter problem, however, is more serious in the data proces- 
sing stage and normally one of two procedures is followed (1) ; the 
first procedure is to discard any attempt to generate sufficient in- 
formation to specify completely, the path to be followed and to 
procedure merely sufficient interpolated points to enable the path 
information to be given to some specified degree of departure from 
the true curve. Such a system would be called an interpolating sys- 
tem. The second procedure is to generate a curve which approxi- 
mates to the required curve to any specified degree of accuracy ; 
evidently for this kind of work an electronic computer is required 
if the arithmetical labour is not to be excessive. 

In an interpolating system, the points may be connected by any 
form of curve but, in practice, either a straight line or a parabolic 
arc is used. Such systems may be called linear or parabolic inter- 
polating systems. 

One or two of the existing interpolation systems dispense with a 
computer and the whole of the calculation for the intermediate 
points must be done by manual calculation ; one British system 
makes use of an analogue method of parabolicinterpolation. Apart 
from these, it is customary for interpolation systems to employ a 
general purpose computer which, however, may carry some spe- 
cial sub-routines to enable commonly occurring curves, such as 
circles, to be handled with a minimum of information e.g. the co- 
ordinate of the starting point and the centre of curvature. The curve 
generating system on the other hand, virtually demands either a 
special purpose digital computer or a specially programmed ge- 
neral purpose computer. The available curve generating systems, 
British, American and Russian, all offer the facility of programming 
for straight lines and conic sections with the minimum of input in- 
formation. | 

Whether a computer is used or not is almost entirely a question 
of economics. Evidently, in any system, the whole of the calcula- 
tion work could be done manually ; indeed, in the original M.I.T 


(1) It is assumed that, at this stage, the numerical information available about 
the desired path is in the form of co-ordinates for sufficient points to define the 
curve satisfactorily. 
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numerically-controlled milling machine, this was done, with the 
result that programming took several days. Tending towards the 
other extreme, a special-purpose digital computer may be employed ; 
this probably goes as near as is currently possible to the ideal, whe- 
reby the designer’s thought-process passes to the machine without 
human agency. Assuming that the computer is used almost all the 
time, its cost may be compared with the cost of manual calcula- 
tion ; this assumption however is rarely justified and the control 
system manufacturers have wisely established computer centres, 
the services of the computer being bought at an agreed time rate. 


c) Power source for table movement. 


Whatever the physical nature of the motor, it must be suited to 
respond adequately to a servo-type of control. So far only hydrau- 
lic and electric motors have achieved any great degree of success. 
Both rotary and reciprocating hydraulic motors have been used to 
supply the power for operating the movable member. 

Among the various types of electric motor which have been used 
are induction motors (normally two-phase wound), D.C. motors 
with either field control or armature control by means of thyra- 
trons, stepping motors which rotate in discrete steps (these steps 
being counted electronically) and motors with clutch couplings on 
either the eddy current or hydraulic principles. 


d) Transducers. 


As mentioned previously, the input information is essentially 
digital, but the transducers may be classified as either analogue or 
digital. The analogue type transducers which have been used in- 
clude measuring bars and pick-ups, various forms of synchro or re- 
solver (including the patented multi-pole resolver known as the in- 
ductosyn), potentiometers, differential transformers and induc- 
tion potentiometers or auto-transformers. Digital type transdu- 
cers which have been used include optical diffraction gratings, in- 
terrupted beams of light, magnetron beam switching tubes and 
digitising discs working on either a contact or induction principle. 
This form of classification has the advantage of indicating whether 
the language of the transducer is such as to require conversion be- 
fore comparison takes place or not. An alternative system of clas- 
sification having some merit is that which distinguishes between 
the ways in which the transducer senses the movement e.g. it may 
sense the movement directly, it may sense the movement indirec- 
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ly (via a lead screw and nut or rack and pinion) or it may be capa- 
ble of either means of sensing. | 

One of the most important features of any transducer for automa- 
tic control of production processes is its resolution, i.e. the smallest 
change in length which it can detect. The resolution and the accu- 
racy of a transducer are not connected but since any desired move- 
ment must be an integral multiple of the resolution, it is seen imme-, 
diately that the resolution limits the precision with which a posi- 
tion may be specified ; for example, a system having a transducer 
with a resolution of 0.007 inches will not permit positions to be 
specified to the nearest ten thousandth of an inch. The quotation 
of an accuracy is merely a tacit admission that the transducer is 
not perfect, the result of which, in practice, is the fact that the mo- 
ving member will not come perfectly to the commanded position, 
but only within a certain zone whose magnitude is dependant on 
the accuracy of the transducer. However, if the moving member is 
repeatedly commanded to come to this same position, it should 
come to rest within a much smaller zone than that dictated by the 
accuracy ; this zone may be termed the repeated accuracy or repea- 
tability. 

When it is realised that the moving member may be required 
to move over a range of several hundred inches and yet have its 
required position specified to a thousandth, or even a ten thousandth 
of an inch, it is apparent that a resolving power approaching one 
in a quarter of a million is required. It would be an ambitious sys- 
tem which attempted to perform this in one stage and normally 
all systems have at least a coarse and fine transducer if this trans- 
ducer is of the analogue type. The function of the coarse transducer 
here is merely to eliminate the ambiguity which would otherwise 
arise if the fine transducer were used alone. Systems employing 
transducers which have no inherent ability to discriminate direc- 
tion of movement frequently employ two transducers to provide 
a sine and cosine pair of signals thus enabling the direction to be 
sensed. 


POSITIONAL CONTROL SYSTEMS 


This name may be given to the type of system in which the mo- 
ving member has to move from one position to another with no 
regard to the path followed in between. Such systems merely re- 
quire the new position to be read from the tape or cards and the 
table will come to rest when the feed-back signal from the transdu- 
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cer gives no error signal upon comparison with the command si- 
gnal. 

In general, the most difficult problem with a positional control 
system, where accuracy and positioning is important, is the final 
positioning of the table where the velocity of the moving member 
is approaching zero and, consequently, the effects of low velocity 
friction present a serious problem to accurate positioning. A con- 
siderable amount of research work has been done on the question 
reducing the frictional force between table and the guide ways and 
much of this has been reported by the Cincinnati Milling Machine 
Company [i] and Kcenigsberger [2]. 

Positional control systems which exhibit the highest order of 
accuracy normally use, as transducer, a multi-pole resolver (in- 
ductosyn), a differential transformer, a measuring bar or a diffrac- 
tion grating. Various forms of digitizing disc, simple two phase re- 
solvers (or synchros) and potentiometers are quite satisfactory as 
transducers for systems of medium order of accuracy ; less refined 
forms will serve as transducers for systems of comparatively low 
accuracy. As has been pointed out previously, there is a field for 
systems in which the accuracy is not high ; there are many produc- 
tion activities in which a moving member has to be positioned in 
a large number of irregularly arranged points and yet the accuracy 
of positioning is not required to be high. 

Some 40 systems of positional control are available at the pre- 
sent time, most of them being either British or American. These 
systems have been described in considerable detail by various au- 
thors and in particular by Brewer [3]. The positioning speed and 
class of accuracy, as might be expected, varies considerably, but 
nearly all systems provide some means of permanent storage, the 
most favoured means being punched tape ; several systems pro- 
vide a temporary storage medium as an additional feature, usually 
by means of decade switches. The most popular storage codes are 
decimal and binary-coded decimal ; very few systems use pure bi- 
nary coding for storage and only one known system is complete- 
ly binary throughout. 


CONTINUOUS CONTOUR CONTROL SYSTEMS 


These are the systems which have to exercice a continuous con- 
trol on the path followed by the moving member, i.e. they must 
control displacement with respect to time for one or more axes. 
Evidently in this case the phase delay in the general servo loop is 
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considerably more important than in the case of a positional con- 
trol system where the time taken for the moving member to come 
to its final position is, within reason, immaterial. 

Most of the systems are American, although two British and two 
Russian systems are at present working. Many of these systems 
have been considered by Williamson [4] and Farmer [5] and a ge- 
neral discussion of all the systems has been given by Brewer [3]. 

Considerable impetus to the development of such control sys- 
tems in the United States has been given by the Air Material Com- 
mand which placed sufficient substantial orders with many 
American firms to justify the development work from an economic 
point of view. Although the total number of systems ordered was 
later cut down quite considerably it still provided a sufficient in- 
centive for the development of several systems of continuous co- 
tour control. In the United Kingdom, two companies have sponso- 
red research and development of control systems, financing this 
work from their own sources. In the Soviet Union, ENIMS has been 
entrusted with the research and development work for automatic 
control systems used in conjunction with production processes. 

The introduction of these various forms of automatic control 
means a considerable reorientiation of thought from management 
down to the operator on the shop floor. The design and drawing 
offices have to accustom themselves to preparing design informa- 
tion in alternative forms to the conventional engineering drawings 
and future developments suggest that the rather large gap which 
exists at present between the outcome of the designers thoughts and 
the absorbtion of information by the machine may be considerably 
narrowed. Some thoughts about possible future developments along 
these lines has been given by Siebel [6]. As mentioned previously the 
advent of this form of automatic control means that no longer are 
large quantities required in order to justify automatic working. 
Indeed, it has been shown [3] that in general, there is no appre- 
ciable further saving in cost per component once the batch num- 
ber has reached a figure of about 10 or 12. When very high numbers 
of components have to be produced, it may even be that conven- 
tional mechanization methods would be slightly more economic 
than automatic control. 

The whole of this subject is still, comparatively speaking, in its 
infancy and the object of the present paper has been to indicate, 
rather broadly, what has been achieved so far; in particular, it is 
hoped that attention has been drawn to the difference between 
mechanization and automation, i.e. the simulation of purely manual 
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techniqués as against the simulation of mental processes in addi- 
tion to manual techniques. Admittedly, at the moment, practical 
development of the implementation of thought processes has not 
progressed very far, certainly not as far as one might wish ; however, 
the initial steps have been taken and undoubtedly the most im- 
portant developments in the control of production processes will be 
along these lines. Indeed it will be quite evident that mechaniza- 
tion as such has virtually reached its limit. It is equally clear that 
mechanization techniques apply only to a limited section of indus- 
try. There is a tendency at present to misunderstand or misdefine the 
word automation and then to make a series of deductions on this 
false premise. This can only be harmful to the development of the 
cybernetic idea in production process control. 
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It is my intention in this article to return once more to a conside- 
ration of the central problems of cybernetics. What are the neces- 
sary and sufficient conditions for the construction of learning or 
self-adapting systems ? The main present object however is partly 
psychological in that I wish to take over the concepts from machine 
construction to the concept of organismic learning to see if we can 
sharpen our idea of what learning entails. 

While reconsidering some of the principal factors that will be 
of central interest to experimental psychologists and ethologists, 
we must alsc try and develop our knowledge of the general design 
of such machines. In this respect, from a general point of view, we 
cannot escape the problems of semantics. The use of terms like 
‘6 learning ’’, ‘ problem solving’? and ‘thinking’? are vague 
and ill-defined, and we should thus aspire to some sort of semantic 
and logical clarity. 

I shall now restate what I take to be the fundamental problems 
of cybernetics, and then I shall state some of the methods by which 
I might hope to acquire a solution for them. 


1. The overall problem is to produce a blueprint for a machine 
or computer that can perform the same operations as human beings 
perform and perhaps more besides ; at any rate I shall say it must 
be inductive and not merely deductive, and produce specified out- 
puts for specified inputs. 

2. In particular, and this is a different problem, we may wish 
to show how any inductive system can exhibit learning and problem 
solving ability at the same level of complexity (and using the same 
methods) as the human being. 
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3. Ultimately we shall be interested in designing our machines 
under 2 as simulators of human beings. 

4. We may finally aim at reproducing these conditions using the 
identical electro-chemical colloidal materials used in humans. 


There are many other problems and applications of cybernetics 
in all manner of ways but these do not concern me here. 


The methods which I shall consider are the following : 


1. We might programme a general purpose digital computer in an 
appropriate manner. 

2. We might consider what generalizations are necessary on a 
Turing Machine to make it deal with inductive programmes. 

3. We might build special purpose machines and computers of 
any conceivable fabric. 

4. We might give a blueprint of an inductive machine or com- 
puter. 

5. We might construct our blueprint in many Ways involving 
set theory and game theory, but our main requirement is that our 
description should be effective and this suggests the use of neural 
or logical nets (Pitts & McCulloch, 1943 ; George, 1956, 1957). 


Probably all these approaches need to be developed together and 
certainly it seems to be the case that we have lots of partial models 
that need to be translated into some common form. : 

I shall try to show how the stages of our machine can be built up 
using various different descriptive languages. But first we must 
consider what is meant by an inductive machine — and by impli- 
cation a deductive one. 

There is no point as yet, in trying to give a precise definition 
of the inductive process, but it can be characterised easily in various 
special terms. In the business of language translation, the problem 
of translating from one language to another is at least in principle, 
strictly deductive provided both languages are already known — 
all that is needed is a dictionary. If however one of the languages 
is not known then the problem is inductive, at least until such time 
as the dictionary can be constructed. In the same way it looks as 
if there are two phases in learning : firstly, the presentation of the 
problem which has to solved ; secondly, the application of that solu- 
tion in performance. The application, after the problem has been 
solved, is a deductive process, although the recognition of the appro- 
priate place to apply a solution is an inductive one. 

There are many other examples, such as games, where in learning 
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the tactics one is behaving inductively, although having learned 
the tactics their application is a purely deductive procedure. 

These matters themselves contribute to a new view of what is 
involved in the learning process, and we shall attempt to utilise 
this knowledge in framing a clearer picture of what we are sear- 
ching for under the name “ learning ”’. 


PROGRAMMING A COMPUTER INDUCTIVELY 


The problem of learning involves the problem of induction and we 
shall first investigate this problem in the general purpose computer. 

Normally in the digital computer we feed in the instructions and 
certain numerical data and allow the computer to compute the ans- 
wer. We know from Turing’s work on computable functions the 
full range of what can be done Ly ordinary deductive processes and 
we can identify computability with the class of functions which are 
generally recursive. To meet the case of A-computability and par- 
tial A-computability we can extend our concept of general recur- 
sion to the larger class of primitive recursive functions. This means 
that we can effectively compute all the normal functions that we 
meet in mathematics. All this though, leaves untouched the mat- 
ter of developing new branches of mathematics. 

There is no selection of reponses to various stimuli involved in 
the purely deductive operations referred to above; these are es- 
sential in any discussion of learning. We should note that the words 
‘ stimulus ’’ and “ response ” are taken as undefined and in need 
of contextual interpretation. We should also notice that although 
the method of discovering answers is purely automatic, the ans- 
wers so derived may be quite new to the person discovering them. 
This point goes deeper than this and we should notice that if we 
are behaving inductively in “ learning ” the tactics of a game, we are 
not necessarily learning anything novel to the human race (the 
process of converting inductive to deductive statements is a tran- 
saction hetween a man and his environment,or indeed between men). 

The implication is that we must regard the computer as program- 
‘med only in general terms, and it must be capable of re-program- 
ming itself as a result of the input it receives. Thus we might think 
of the input tape as representing the environment of the computer 
and the output tape as itself being part of that input tape, since the 
computer must be made aware of what has been its own response to 
previous inputs. This does not necessarily imply that the input tape 
will carry a record of the output, rather it suggests that the output 
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will itself be stored inside the machine, although the results of a 
particular output may certainly influence the subsequent input. 
This is obvious if the computer plays a game against a human oppo- 
nent when he must wait until his output is noted and the human’s 
output recorded on his own input tape. This means a slowing down 
of the machine in its public transactions — a point we should re- 
member — and it is also important in the functioning of selective 
reinforcement (motivation) since until the consequences of a res- 
ponse can be recorded on the input tape no selective reinforcement 
will be possible. 

The speed at which the computer could play a game against it- 
self would be greater than when playing a game against an opponent, 
and the playing of the game against itself for a range of possible 
choices of a hypothetical opponent is somewhat like the human pro- 
cess called “ thinking ”’, particularly when we generalize it to meet 
all the computer’s transactions with its environment. 


Let me consider next the nature of the instructions that will be 
needed. They will be considered first in the context of some game. 


1. The rules of the game must be stated and stored and examined 
before any move is made. 

2. The initial behaviour may be random, and the results of the 
moves recorded. Space forbids that every game should be recorded 
in detail, but that a table of probabilities should be set up in the 
manner of the digrams, trigrams, etc, of Shannon (conditional pro- 
bability tables representing Markoff processes). 

3. It is impossible to store all the tables one needs if the game 
is at all complicated, so it is suggested that only those events of 
length three (Kleene, 1956) that have actually occurred should be 
recorded. The event is made up of a stimulus, a response and the 
next stimulus. We could here call this an input letter, the next out- 
put letter and the next input letter occurring in time. 

From these events of length three, events of greater length could 
be constructed as partial tables for those sequences that are selec- 
tively reinforced — either negatively or positively. We shall say 
more about this crucial matter later on. 

4. Rules for generalizing can now be added to the tables to allow 
the partial construction process and facilitate the space require- 
ments. This too we must discuss. 


In the above list, if we wished the computer to mimic the organim’s 
behaviour from birth then we should have to get it to learn the rules 
from a trial and error basis too, unless we first taught it a language 
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on the same trial and error basis and used the language to communi- 
cate the rules. This may be essential for the generalization in 4. above. 

This last point raises another important issue. If language is 
to be learnt by a trial-and-error process leading to associations, 
these associative processes must later become fixed, or relatively 
so, and removed from the storage of probability tables to a ‘“perma- 
nent storage’’ where explicit input-output (stimulus-response) as- 
sociations occur. This is not to say that once a habit has been set 
up that it can never be broken, rather there is a resistance to brea- 
king a habit, but nevertheless provision must be made for return 
from permanent to temporary storage. What seems to be the main 
problem here is to decide what conditions call for such a revision 
of a habit. This is closely bound up with the way that the permanent 
storage system is organized in the first place. 

It is also possible that the only effective distinction we need is 
between those tables of event three we have already constructed | 
with respect to certain previous experience, and the generalizations 
that may be derived from the setting up of symbols for events 
(language) ; then the general principles are linguistic. It should 
also be noticed that a computer normally has only language as 
its input and if these are equivalent to the empirical world, then 
there must also be a set of inputs that refer to the other inputs ; 
these are symbolic and thus make up a further language — a me- 
talanguage. 

The principles that seem the most obvious in the general organi- 
zation of storage are frequency, recency and value. 

We have previously shown that in a logical net or a special pur- 
pose computer, frequency and recency will always be factors pro- 
vided the system is a classificatory one and provided the number 
of events to be stored are greater than the available storage space 
(George, 1957). The concept of value is certainly more complicated 
and depends on the selective reinforcement. The simplest establis- 
hing of values would be to posit a K-number that accompanies 
each event of length three stored so that the k-value receives an 
increment of + 1 when the outcome is successful and — 1 when un- 
successful, o if neutral. To account for a variable such as strength 
of stimulus we could, of course, weight these numbers appropria- 
tely. Then our simplest storage registers would be made up of five 
numbers 


A/B/C /p/k 


where the A/B/C represents an event of length 3, and p, the proba- 
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bility that given A, C will follow if B is performe d, and k the appro- 
priate value of the event. Thus given A, the machine must scan the 
set of all triads (as we shall call them) and will select that with the 
highest k-number. 

An obvious difficulty now presents itself. If the game is to be 
played or the behaviour pattern to be analyzed is relatively simple 
then it will be easy enough to decide whether a particular triad is 
to be positively reinforced or not, but in a game such as chess it 
will be difficult to decide whether a particular move is a“ good” 
one or not. This suggests that we should devote some attention to 
partial solutions. 

The first suggestion that may occur to the reader is that any 
occurrence that is near in time to an occurrence that is designated as 
‘wood ”” will itself be good and vice-versa. For chess this would mean 
any move that was associated with the winning move or even in a 
winning game, and this would seem not of itself to be sufficient. 

The assumption we shall make here is that moves will be reinfor- 
ced only in terms of their occurrence in a winning game and on 
this principle alone ultimately winning combinations will occur. 
At the same time, it is clear that certain situations will be capable 
of being deductively followed to an end state and these will be ac- 
corded values appropriately, and secondly as a result of the use of 
principles of generalization it will be soon clear that certain general 
positions are winning ones. 

If the interest is now in a machine that is not demonstrating that 
particular techniques can be acquired by selective reinforcement with 
a random start, then we can build in any principles that seem to be 
helpful to weight the response of the machine. But where we have 
no decision procedure, we stand the risk of weighting the machine 
away from the optimal approach. : 

It seems clear that we must now take up the matter of generali- 
zation. If storage space were unlimited it seems that generaliza- 
tions would be unnecessary, since confronted witha particular event 
or state the machine would simply investigate every previous si- 
milar state ; yet if it did this also it may be confronted with 
state that had never occurred before and it would fail to respond 
correctly unless such a case were covered by some sort of genera- 
lization. 

The method in general is one of searching for relations, and it 
demands that the tables of conditional probabilities be scanned for 
the recurrence of certain combinations of events on some criteria of 
similarity. 
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The most obvious example of the sort oi criteria needed would be 
that of recognising that an odd number for a second move innoughts- 
and-crosses where the opponent has started in the centre square and 
where the board is numbered with o in the centre and starts around 
the board with rin the top left corner is fairly obviously a best move. 
This demands that it is possible to say of a set of triads that a set that 
is always unsuccessful has a particular property or vice-versa, and 
this presupposes some knowledge of their properties, although not 
entirely so, since the search for similarities may be expected to re- 
veal previously unknown properties. 

It is easy enough now to see the general form an inductive pro- 
gramme may take. Storage systems are allocated triads, a selective 
reinforcer is built in, and this can be set at any level of generality 
or to work in accord with any principle. The simpler the better, in 
general, since often we shall want to discover the principles it itself 
acquires as a result of its associations. There may be principles of 
generalization, built in or to be acquired according to our problem, 
and there must be the possibility of transfer to and from the perma- 
nent store in accordance with the principle of value. 

Some programmes have been devised in such terms and have 
shown some measure of success — the principle handicap is lack 
of storage space which means that the computer cannot do what a 
human does — treat problems by analogy and draw on a vast storage 
of information, particularly in the form of concepts or generali- 
zations. 

In the same way as we find that we can describe the recognition 
process in the terminology of empirical logic of classes — where the 
problem is to ascribe a probability to a subset being a member of a 
particular set — so here the problem is the mapping of relations on 
to the calculus of probability. In practice we may need to substi- 
tute rough estimates rather than precice counts, and the levels of 
significance will be a function of the values, but the problem will 
still be to estimate the probability of one event being related to 
another event, generally contingent upon some response of the ma- 
chine-— hence the suitable description is in the calculus of empiri- 
cal relations. 

While not regarding our account of inductively programming 
computers as in any way complete, let me turn to the problem from 
the point of view of Turing machines. 
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INDUCTION AND TURING MACHINES 


We have already hinted at the problem for the Turing machine. 
Given the quadruples which define the machine it is easy enough 
to investigate the computability of various mathematical functions 
by deterministic or probabilistic means (Turing, 1937; Davis, 
1953). 

Our problem is simply one of asking how, given the desire to 
acquire information about complicated entities such as arise in 
mathematics, or given the desire to show a particular function 
computable you should acquire tne necessary quadruples, star- 
ting from trial-and-error behaviour, or from some more general 
starting point. 

The problem is essentially the same as that met previously in 
programming a general purpose computer. What we should need 
to show is that a particular programme (set of quadruples and sui- 
tably printed tape) could be devised starting from a trial-and- 
error basis. It would be easy to answer the problem by taking col- 
lections of state-symbols and tape-symbols and rearranging them 
in such a form that *‘ playing the game ”’ of computing a function 
can be achieved starting from a trial-and-error basis. 

Of course, no one ever programmes a Turing machine without all 
the necessary general concepts of numbers, of arithmetical opera- 
tions and so on. Given these general concepts, there is no difficulty 
in following quickly through the trial-and-error procedure referred 
to above. Indeed it is a process of ‘* insight ?” rather than trial-and- 
error since attempts are made with sets of state symbols and tape- 
symbols already highly organized. At the same time, we have to 
fulfil a short (possibly quite long) period of trial-and-error. 

All that has been so far said about Turing machines, is dependent 
upon what we said about symbols and language. 


RECOGNITION, PERCEPTION & STORAGE 


Various machines have been built (Uttley 1954, 1955; George, 
1956, 1957, 1958; Walter 1951, et al) to show that the method 
of classification which is used in computers is the same in essence 
as the method in the human being. This work is too well known 
to be repeated here. However there are some relevant points to 
remember, since in our search for a clearer concept and defini- 
tion ot learning, we cannot afford to disergard the perceptual as- 
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pect of learning — what some people have called perceptual lear- 
ning. 

Perception can be conveniently described in a calculus — what 
we might call an empirical calculus. 

The problem is one of connecting subsets to sets. Does a parti- 
cular subset A belong to another set B or not, or is A an improper 
subset ? This is to be interpreted under the circumstances where 
A and B are made up of properties a,b...n. Clearly A belongs to B 
if it has properties that are included in B and those only, and A is 
identical with B it they have all the same properties. Now we might 
guess that the recognitional and perceptual processes are largely 
made up of situations which are the allocation of class membership 
to sets, where the allocation is made as a function of value, and time 
taken making the decision. Also it seems certain that the pattern 
of behaviour spreads over a series of events which supply a context 
and influence the ‘ set ’’ of the subjects to be classified. 

We can write the statements of tne perceptual process in the 
following form : 


RABp, SCDar. NGKHS 


where R, S, N and the relations between classes A and B, C and D, 
an so on, and the relationship here in the perceptual process is 
simply class-membership. The letters p,q...,, n, give the probabili- 
ties of the relations holding where the decision in general is a func- 
tion of the subrelations of any relation. Thus if R can be written : 


WT) ieee et 


then the ratio of present to total subrelations r,; would be a measure 
of the probability of the relation R holding. These probabilities 
may be weighted of course with respect to certain properties as a 
function of the value number. In the special case of recognition 
and perception, the subrelations are simply the existence of non- 
existence of the appropriate properties. 

We are not here concerned to develop the calculus of empirical 
relations but to use the concepts to give us an idea of how the 
perceptual system works. 

When an object has been recognised (correctly or not) we imply 
the allocation of class membership, and the system now acts as if 
the object were A say, even though it is not. If the price of the mis- 
take is small or not effective then the small difference between B 
say (which it really was) and A will be glossed over and a generali- 
zation of similarity (stimulus generalization) will have taken place. 
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If the response is highly negatively reinforced then the recognition 
process will be repeated if possible with a greater weighting in the 
future on the properties that were omitted at the first recognition. 

It is easy to see that the recognition process — and we shall 
think of recognition and perception as more or less identical for our 
present purposes — is an effective one that a machine could be 
built to reproduce. The cost of doing this on a large enough scale 
would however be very great and there is not too much point in 
doing it unless we can link the process to the rest of the storage 
system which is likely to prove the key to the learning process. 
This suggests that our most important current search is for a cheap 
method of producing computers or machinery to mimic human 
organisms ; we shall say more about this in a minute. 

The store that contains a record of events in the past of the 
organism must clearly be large and we shall also want to know the 
method of its organization since here if anywhere is the key to 
learning. 

If we had a storage system that could record every event that 
ever occurred to it and the order in which those events occurred, 
it could reproduce responses that were appropriate, granted of 
course that every response was selectively reinforced, even though 
it may take a very long time to search through the store to find the 
appropriate previous occurrences. In fact since the need for speed 
in response is often great — if the organism is to survive — the need 
for some more economical storage system would in any case be 
inevitable, this quite apart from the limitations of space. 

The storage system that seems necessary is a storage of Markoff 
tables —- conditional probabilities over events of length two, three, 
four, etc. 

In practice though, it is easy to see that if we had to store proba- 
bilities over events of length four for any fairly large set of events 
and all their possible permutations, then the storage system would 
once again have to be enormous. This suggests a method of storage 
that permits the construction of partial tables as they are needed. 
There is one pecularity which we should notice here. It seems that 
one can recall particular details of the past if necessary when one 
is called upon to, and the fact that they have to be called up from 
what we call the ‘* unconscious’’ suggests that the whole of our stora- 
ge system is not immediately available ; it is rather as if we had a 
magnetic drum as well as higher speed storage systems and the 
magnetic drum could only be made to yield up its information under 
very special circumstances. However, this may be it is quite clear 
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that those events of detail that can be remembered under psycho- 
analysis (for example) are events of great value, by which we mean 
an event which was highly selectively reinforced (positively or 
negatively) in the past. Everything can clearly not be remembered 
and the factors of frequency and recency as well as value must 
operate in the memory of the human being. 

The problem we are left with is already complicated if we are to 
prescribe an actual mechanism, and this problem is to be made more 
complicated since the existence of habits and degrees of generality 
in beliefs suggests that the system must be able to generalise and 
must also make a distinction between those things actually on test 
as it were, and those things tested and built in. This last distinction 
is one that is very important, and I will try to explain some part of 
its significance. 

It is not too difficult to imagine systems that are capable of as- 
sociating inputs and counting their occurrence either when they 
occur simultaneously or when they are spread over some period of 
time. I have myself described one such a system and built it in 
hardware. Now this sort of system would be uneconomical and would 
not distinguish habits from “ matters of consideration’’. It seems 
that such an association net which effectively gives us a Markoff 
table operates with respect to occurrences that are not associated 
with probabilities that tend to o or 1. As they tend to 0 or I, regard- 
less of the value number say, they are transferred into a simple plug- 
in system where the stimulus simply invokes the response. It is 
clear though that they must also be capable of being put back again 
into the Markoff table basis. We should note that work on such 
things as learning sets ‘ support ’’ the idea that there is a difference 
in the storage of information that is being learned and information 
that has already been learned ; by ‘‘ learning’? here we seem to 
mean no more than the setting up of associations. 

We should now ask ourselves whether there is any distinction 
between learning and solving a problem. It seems there is no diffe- 
rence between the mechanisms involved since there is no obvious 
case of solving a problem that does not involve the setting up of 
“new associations. But we should notice that all problems are not 
solved in the same way in human beings — this at least seems fairly 
certain. This is because there must be many cases of the use of 
analogy, i.e. where certain structural relations such as a series of 
events strung together in a particular way can be taken over directly 
to appropriately describe another situation. This involves the idea 
of generalization once more. The machine store must be capable 


120 F. H. GEORGE 


—_ 


of recognizing sets of relations in various contexts and this is some- 
thing whose need we have already recognized. The question of partial 
solutions, or heuristics, must also arise in this context. It seems very 
likely that the human being must recognise winning positions in 
games or partial solutions in problems. But again there is no reason 
for changing our general approach which remains in the sorting 
and selection of series of events and their relations. 

From our immediate point of view it seems that problem solving 
might be best regarded as a particular type of learning if and only 
if we wish to include all sorts of adaptation under the name ‘‘ lear- 
ning ’’. This is, of course, the problem : what in the machine, and 
what in the human, is to be called ‘ learning ”’ ? 

Our attack on learning has been from the machine to the human 
as well as from the human to the machine, and there is one further 
point that stands out on the machine side. 

Should the receptors of our classification system be specific to 
some type of stimulus ? Should a particular set of receptors be 
responsible for recording greeness or roundness, or some other 
property, or should the receptors be generalised and communicate 
greeness and roundness as a result of the message travelling in a 
receptor ? In our computers we find both methods used. Our 
assumption has been that nature represents a language to be 
decoded and the learning system in humans is simply the system 
that does the decoding. 

It rather looks as if we ought to regard our receptors as being 
mixed ; some are specific and need no internal code, others are 
generalised and may carry a whole range of information. Even of 
course for specific receptors there will be properties that emerge as 
a result of the pattern of the firing and these properties may be 
retained as coded material inside the central nervous system ; and 
where coded this may be precisely the role of language in the human 
being. 

The reasons for the above are the direct result of considerations 
of economy in the computer system, to handle the same sort of 
range of information as the human with something like the same 
number of two-state cells or neurons. It is clearly also consistent 
with what we know of the physiology of the human being. 

Perhaps the most plausible system records all information in 
storage in the coded form and it remains to be shown how this could 
be done. 

In the previous discussion of recognition we have said nothing 
about how the machine learns to recognize as it must, and as humans 
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probably do. This suggests the use of a processing of the visual and 
other sensory images by transformation such as rotation, magni- 
fication, etc. to bring them into coincidence with some standard 
pattern (Culbertson, 1950). This leaves us with a doubt — one of 
many — as to whether the visual system, for example, processes 
its images independently of the other sensory systems and whether 
such a processing is necessary since learning of shapes can depend 
upon the listing of certain subsets which have certain relations with 
each other as all being members of the class of images (sense-data) 
associated with a single object. The demands made upon storage 
space, perhaps suggest the image-processing procedure at least 
during the learning period, after which the sampling procedure — 
where size of sample must be a function of the value number and 
probability associated with next expected occurrence — will “ short- 
circuit ’’ the full range of image processing. This question requires 
detailed attention and detailed comparisons between models and 
histological studies. 
We must now turn away from this all too brief discussion. 


THE FABRIC ON CONSTRUCTION 


There is another question that must now be discussed before we 
return to summarise the problems already mentioned. This is the 
problem of the fabric of what are sometimes called cybernetic 
systems. In particular I wish to further consider some of the 
problems that have been raised by Gordon Pask in the pursuit of his 
ingenious teaching machines. 

Pask’s original teaching system copied the behaviour of a human 
subject and selectively reinforced what was necessary to the human 
subject’s learning. This often involved operating without well- 
defined conceptual materials so that information was often incom- 
plete and the resulting operations probabilistic in an obvious way. 
(Pask, 1958; Beer, 1958). | 

These ideas and mechanisms of Pask are exceptionally ingenious 
and apart from their practical utility they emphasised the interac- 
tion between a learning subject and that subject’s environment. 
There is clearly a two-way flow ot information and this is necessary 
to teaching taking place. 

Pask himself went on to consider the possibility of systems that 
exhibited actual growth and represented concepts and their organi- 
zation as a result of this growth process. This itself suggested that 


122 F. G. GEORGE 


the methods of hardware so far used in constructing learning systems 
was inadequate. 

I would want to say straight away that while I am wholehear- 
tedly in favour of the idea of using organic and chemical models 
to mirror this most important growth process, I would not agree 
that this was necessary to the demonstration of the learning process 
itself. In other words I would maintain that a digital computer is 
able to learn in a well-defined sense and show the analogue of 
growth processes in a manner that is as convincing as in an organic 
model. 

To try and clarify this point a little further, I will quote Pask’s 
principal objection to the sort of system built by Grey Walter, 
Uttley and myself. They all seem to fall foul of a particular condi- 
tion which we may state in Pask’s own words : 


‘ An assemblage must force the observer to interact with it, in 
the sense that interaction yields benefits. It must be an assembla- 
ge for which the reference frame is badly specified and we are 
seeking a physical condition on the assemblage which makes a 
well specific reference frame difficult or impossible to construct’’. 


Pask goes on to say that this leads to the idea of an assemblage 
that is made up of undifferentiated material that grows. It is not 
obvious to me what Pask means by these claims. In the models 
that are inadequate on the above condition, there is no lack ot inter- 
action between the model and the user, since the user is playing the 
part of the environment. Indeed in our learning systems there will 
generally be an interaction not so much between different models — 
although, of course, this can happen—- and between a model and its 
environment. The interaction I have here inmind is just that which 
is involved in any observation process, and goes back to Heisenberg 
and the various forms of phenomenalism. 

I believe there may be some confusion here due to the different 
aims underlying the different people involved. I shall speak for 
myself in saying that I would regard my own principal problem 
solved if I could programme a digital computer to learn from a speci- 
fic environment how to play some game of which it had originally 
no knowledge ; this would be the same sort of thing as showing 
how a machine might find out what quadruples were necessary to 
solve a particular Turing problem, granted that it acted initially 
on a trial-and-error basis. Or even giving the computer all the induc- 
tive methods we have available, to see whether it could utilise them 
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to discover facts about its environment (our environment) that we 
have not been able to discover ourselves, and perhaps new methods 
of investigation as well. 

It is clear to me that to achieve this end the model must be 
differentially reinforced ; it must therefore have an interaction 
with its environment. It is not in the least clear to me that it has to 
start in an undifferentiated state and show actual growth. Although, 
of course, the fact of growth may be a great help. The computer 
while learning is not necessarily merely a “ gene’ which we can 
start and then can no longer control, since we can always interact 
with it with an eye to controlling it, by the means of directly 
controlling its environment. 

I shall leave this point now, since it is one that requires a great 
deal of special consideration and clarification, and is not obviously 
crucial for the reproduction of artificial learning procedures. At 
the same time, since cheapness in model construction is vital, in 
view of the vast size of models we are likely to be interested in, it 
is certain that Pask’s and other people’s efforts to make chemical 
and organic models are of the first importance. 

There is one interesting point that we should notice in the above 
connection. While discussing the inductive programming of a com- 
puter, we seemed to have to designate what we called a ‘* value 
number ’’. This was because there is no motivational system built 
into a digital computer. In our special purpose computers we build 
in the system. that achieves values and lets values so designated 
permeate the system by association. Here there is a sort of difference 
between hardware systems and organic systems. It is possible that 
organic systems might, if suitably chosen, have all the motivation 
built into them, whereas in our more artificial case we must clearly 
designate their starting values and we shall make these appropriate 
for the purposes we wish the machines to perform. 


A DEFINITION OF LEARNING 


We must ask ourselves now whether our investigations have done 
anything to clear our minds as to what is necessary to learning, or 
what the word “learning”? has to mean to be consistent with 
the sort of behaviour we observe in organisms. 

Hilgard has defined ‘ learning ” as 


« The process by which an activity originates or is changed 
through training procedures (whether in the laboratory or in the 
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natural environment) as distinguished form changes by factors 
not attribuable as a result of experience”. 


: Thorpe has suggested a slightly different definition. 


“Learning... is defined as that process which manifests itself 
_by adaptive changes in individual behaviour as a result of expe- 
iiience:. 


_ There is no need for a detailed analysis to see how vague and 
general these two definitions are. It is precisely ‘‘ training proce- 
dures ”’ and ‘* adaptive changes ”’ that need explaining. 

_ We can accept that all organic systems have built-in connections 
analogous to the construction of a general purpose computer without 
its programme, and analogous to the relation of a Turing tape to 
its scanner, or the actual connections of a special purpose computer. 
And we can also accept the fact that damage to any of these systems, 
which necessarily changes them and any built-in growth process 
(cf. maturation) will be excluded, perhaps arbitrarily, from learning. 
Certainly over and beyond all these aspects of change are the facts 
of making and breaking associations in some manner. 

My own work on cybernetics suggests that what is necessary to 
this process can be summarised in the following principles : 


1. Classification, which is necessary to any system which records 
its environment. 

2. Storage, which is clearly necessary to any adaptive or intel- 
ligent behaviour. 

3. Counting which is necessary to any deductive as well as induc- 
tive behaviour, although it is not sufficient even taken together 
with 1 or 2 to produce the adaptive changes that we may all agree 
we observe in ‘ learning ??. 

4. Selective reinforcement seems to provide the necessary gulf 
between passive and purposeless behaviour and full organic beha- 
viour. 

5. Principles 1 to 4 we shall claim are sufficient for learning, but 
for an economic size of system, which must work sufficiently 
quickly, we may add the methods of approximation, that are in- 
volved in stimulus generalization, and stimulus-response genera- 
lization, which allows economic storage and therefore increases the 
range of possible behaviour. This too depends on selective reinfor- 
cement and classification and is implicit in an economic classifica- 
tory system. 
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All these statements should not obscure the point that there 
are still many alternative ways that system could work, within 
these principles, quite apart from the search for the particular way 
the human nervous system works. What, however, is brought out 
more clearly is that learning can be thought of as a combination 
of deductive and inductive procedures and is inevitably a sort of 
blanket term used for their interaction, when selectively reinforced 
under a wide range of conditions, which include problem solving 
as well as trial-and-error learning activities. We might now feel 
happier that it is not so much a careful definition of ‘‘learning”? that 
we need as a realization of what functions are necessary to adapta+ 
tions taking place that lead to the organism being able to perform, 
operationally speaking, the same acts as human beings can perform. 
In other words we are concerned to show the necessary structure 
and function of systems that can solve the same sort of problems as 
humans solve and achieve the same sort of habits when placed in 
a similar environment. This should leave us less anxious to give 
precise verbal form to our understanding of what seems to be a 
roughly unitary process only on the surface of things. 

We shall further remember that the models and principles we 
have been describing are too precise and deterministic to more than 
illustrate the principles, and that they should be regarded in a more 
statistical light for purposes of neurological modelling. We can of 
course specify complexes of events in logical nets as statistical func- 
tions which will be convenient for some purposes or we might 
indicate the degree of association by reference to the particular 
number of impulses being fired. It seems unlikely that the human 
being could do more than give an approximate count which is in 
any case weighted by the value of the events concerned. 

This general article is not an appropriate place to discuss det- 
ailed methods of model constructing, but enough has perhaps been 
said to indicate this particular point of view which must prove 
necessary as we move forward to attack the problem of mirroring 
the actual biological structures used by the human being in his 
learning procedures. 
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Remarques sur une théorie 
base de lapprentissage 


par Gabriel LORENTE, 
(Madrid) 


On peut assurer que l'adaptation de l’homme au progrès est due à 
sa capacité d'apprendre. Les races humaines qui étaient douées 
d’une faculté supérieure d’apprentissage, ont pu résorber très 
rapidement les retards qu’elles avaient supportés ; par contre, le 
principal obstacle à la promotion d’un individu ou d’une communau- 
té, est constitué par l’absence de capacité d’acquérir des connais- 
sances nouvelles ou d’assimiler des techniques neuves. On peut 
affirmer, parallèlement, que l'efficacité et la qualité des machines 
automatiques sont mesurées par leur capacité quantitative d’ap- 
prendre, c’est-à-dire d’emmagasiner des données et de garder des 
structures directrices selon lesquelles il faut les employer et diriger 
leur fonctionnement. 

En réalité, les machines automatiques qui existaient avant l’avè- 
nement de l’ère automatique (dont le début coïncide avec la seconde 
guerre mondiale) exécutaient les mêmes opérations fondamentales 
que les machines actuelles ; ces dernières diffèrent par l’accroissement 
considérable de leur puissance d’apprentissage dû au perfection- 
nement des systèmes de mémoire permettant un emmagasinage 
plus efficace des informations. Nous tenons à souligner en raison de 
de l'importance de notre affirmation pour nos considérations ulté- 
rieures, que l’individu — et dans une autre proportion la machine — 
acquiert, dans l’apprentissage, de nouvelles données et de nouvelles 
connaissances, ainsi que de nouvelles structures internes. 

Au cours des prochaines décades, l’industrie et la technique exi- 
geront un nombre croissant d’hommes possédant une instruction 
étendue et, en méme temps, approfondie. Ces hommes devront user 
au maximum de leur faculté d’apprendre pour atteindre le stade 
demandé. Parallèlement, il apparaît indispensable de veiller à déve- 
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lopper la capacité « d'apprendre » des machines en raison des ser- 
vices que nous sommes appelés à exiger d'elles. La cybernétique doit 
s'attacher à étudier les concepts de base de l'apprentissage, parallèle- 
ment avec les structures neuropsychologiques et les mécanismes. 


LES MODES ÉLÉMENTAIRES DE L'APPRENTISSAGE ACQUIS ET 
| SES LOIS DE BASE 


L'apprentissage se réalise suivant un processus très compliqué ; 
il suffit d'observer le développement du processus d’un individu 
apprenant à jouer du piano ou apprenant à résoudre des équations 
différentielles. Il faut d’abord trouver les processus élémentaires 
afin de pouvoir mieux analyser le phénomène d'ensemble. 

Lorsque l’homme apprend, il acquiert quelque chose qu'il ne 
possédait pas auparavant. Quand nous disons, par analogie, qu’une 
machine apprend, nous entendons par la que sa structure s’en- 
richit d’un élément qu’elle ne possédait pas. Nous appelons ce 
phénomène, apprentissage acquis. 

L’acquisition d’un élément nouveau se réalise suivant une mé- 
thode, un processus, c’est ce que nous dénommons apprentissage 
fonchonnel. 

L'élève qui, avec beaucoup d'efforts, effectue des gammes au 
piano pendant des heures, sans interruption, se trouve dans la 
phase de l’apprentissage fonctionnel ; tandis que le pianiste doué, 
qui possède la capacité d’executer les partitions les plus difficiles 
détient un apprentissage acquis. Dans le langage courant, lorsqu'on 
prononce le mot apprentissage, on ne fait aucune différence entre 
l’apprentissage fonctionnel et l'apprentissage acquis, entre le proces- 
sus d'apprendre quelque chose et le fait consommé d’avoir appris 
cette chose. 

Il y a deux formes élémentaires d'apprentissage acquis, dont dé- 
pendent les autres types, plus complexes. La première forme, c’est 
l'acquisition d'une idée ou image. Il faut considérer les mots «idée » 
et «image» dans leur sens le plus large, en incluant les significations 
métaphoriques. Ils comprennent notamment l'acquisition d’une 
idée abstraite, d’une image visuelle ou auditive, et d’une image 
musculaire due à l'empreinte que nous laisse la sensation du tact 
interne a l’occasion d’un effort musculaire de.... Dans le cadre 
de cette forme d’apprentissage élémentaire, l’individu augmente 
ses connaissances avec une représentation de la réalité extra-sub- 
jective. 

La seconde forme d’apprentissage élémentaire met deux éléments 
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de la structure interne de l'individu qui apprend — soit-il un 
être vivant ou une machine — en rapport d’une façon permanente 
et stable. C’est le cas du pianiste qui établit une relation permanente 
dans sa forme psychique, entre l’image visuelle d’une note déterminée 
et l’image motrice de toucher la note correspondante au clavier. 

Il y a chez l'être vivant des relations entre éléments idéologiques 
et affectifs qui existent dès la naissance par la constitution spéci- 
fique de son être, et d’autres relations qu’on acquiert ou apprend 
par l'expérience. Les psychologues ont étudié minutieusement le 
processus d'acquisition de ces interrelations et associations. L’appren- 
tissage qui nous conduit a cette acquisition modifie la structure 
individuelle de l'être d’une manière plus profonde que l’apprentis- 
sage par simple acquisition d'éléments connus. 

On se demande tout de suite si ce genre d'apprentissage acquis 
élémentaire (par acquisition de relations entre les éléments) existe 
chez les machines. On doit répondre que des relations sont a la 
base de la constitution de la machine et qu’on laisse parfois ouverte 
la possibilité qu’il s’en établisse de nouvelles. L’insertion d’une 
cheville au panneau de certaines machines calculatrices établira 
une relation entre la mémoire et l’unité de calcul. Ce qu’il faut 
encore chercher d’une façon plus approfondie, c’est de connaître les 
types spécifiques de pareilles interrelations chez les êtres vivants 
et dans les mécanismes. I] est aussi opportun d’analyser, du point 
de vue de l'autonomie, les motifs et les raisons qui mettent les 
processus d’apprentissage en mouvement chez l’homme et ceux qui 
produisent le même effet dans les machines. 

La loi de base de cet apprentissage élémentaire par interrelation, 
est la permanence ou stabilité invariable, du moins pour un temps 
déterminé. Il n’y a pas de véritable apprentissage si la relation 
établie n’est pas permanente ; dans ce cas, l'apprentissage disparaît 
(instantanément ou lentement) ou change d’aspect en altérant 
les termes connectés. L'apprentissage de notre pianiste s’est évaporé 
dès le moment où le mouvement correct de la main n’est plus en 
connexion avec l’image d’une note déterminée. 

Une autre loi, base de l’apprentissage de relations, est la loi de 
 l’univocité hypothétique. L’univocité des rapports parmi les éléments 
doit exister, au moins dans le sens où la répétition des processus 
d'apprentissage se réalise, c’est-à-dire quand l'apprentissage est 
utilisé par le sujet. Chez l’individu qui a appris à conduire une voi- 
ture, il doit y avoir une relation univoque entre la vue d’un obstacle 
proche et l’acte de pousser le frein. Voilà pourquoi nous avons 
parlé de l’univocité, du moins dans le sens du processus. 
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Cependant, il y a beaucoup de relations apprises chez l’homme et 
aussi même dans les mécanismes, qui ne sont pas univoques 
mais « plurivoques». Un élément du sujet qui a appris est en 
rapport avec deux ou plusieurs éléments dans la structure acquise 
par l'apprentissage et non pas avec un seul. Ces rapports plurivoques 
jouent un rôle important dans l’apprentissage acquis. C’est pour 
cela qu’il faut ajouter « hypothétique » à la loi de l’univocité qu'on 
peut énoncer de la façon suivante : 


«Il doit y avoir de l’univocité, au moins unidirectionnelle, 
d'éléments qui sont en rapport s’il n'existe pas de capacité 
critique proportionnée. Le terme « capacité critique » implique 
le pouvoir de sélectionner une image déterminée parmi plusieurs 
images associées. La multivocité pourra être plus grande, si 
la capacité critique l’est également. Quand la capacité critique 
est nulle, l’univocité la plus rigoureuse s’impose, car l’appren- 
tissage doit être la base de processus utiles et ne doit pas con- 
duire à une activité chaotique. » 


Cette loi est valable, avec l’analogie nécessaire, à la fois pour la 
psychologie humaine, pour la psychologie des animaux, pour les 
mécanismes et engins automatiques, pour la biogénèse et même 
pour des processus de l’histoire politique. En définitive, l’autodéter- 
mination dont un peuple peut avantageusement jouir — multivo- 
cité d’options — dépend de sa capaciré critique de choisir les plus 
utiles. 

L'homme l'emporte par sa capacité critique pratiquement illi- 
mitée sur les machines, dont la capacité critique est nulle ou très 
réduite. La fonction cognitive abstraite de l’homme et la large 
ambiance de son libre dynamisme volitif portent sa capacité critique 
à des degrés si élevés qu’elles autorisent une multivocité extra- 
ordinaire des relations structurales sans danger de s’exposer à un 
désordre de l’activité. Quand les machines démontrent un certain 
degré de capacité critique, comme par exemple chez les « tortues 
mécaniques», elles ont obtenu cette capacité de la prévision de leur 
ingénieux constructeur, comme c’est le cas chez Grey Walter. 


L'APPRENTISSAGE ACQUIS DANS SES FORMES COMPLEXES 


L'apprentissage acquis de relations a généralement des formes 
plus complexes. Nous devons mentionner parmi ces fomes com- 
plexes, l’enchainement d’associations élémentaires donnant nais- 
sance a une chaîne ou réseau. Chaque petit rond de la figure 1 
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représente un élément représentatif ou dynamique du sujet qui 
apprend ou a appris. 


Vi 


Fic. 1. 


Il est possible que la chaîne se soit faite d’une façon complètement 
univogue, au moins unidirectionnellement dans tous ses chainons 
(fig.r, a et b). Dans ce cas, étant donné un état initial, l’état final 
est parfaitement déterminé. Au contraire, si l’umivocité n'existe pas 
(fig.r, c) la capacité critique de l'individu doit entrer en jeu pour 
que la structure acquise ne conduise pas l’action vers une activité 
désorganisée ou sans effet contrôlable. D'une façon mathématique, 
on peut dire que la relation c= F (M) existe entre c, capacité 
critique et M, degré de multivocité, (F) étant une fonction de M. 
La cybernétique, science de contrôle, dont le nom dérive des ti- 
moniers des navires helléniques, doit prendre en considération 
la capacité critique. 

Chez l'individu où existe une chaîne d’éléments associés, il doit 
y avoir également une loi qui impose la direction selon laquelle 
doivent se produire les changements d’un état ou d’un élément à 
un autre ; nous pouvons la dénommer loz entropique dans la cyber- 
nétique. Si elle n'existait pas, un recul de processus pourrait se 
produire à chaque instant et l’on retournerait à l’état initial, où au 
moins on n’atteindrait pas l’état final désiré. Cette loi du sens du 
processus peut être incluse dans divers chaînons par le fait que sa 
relation se réalise seulement dans un sens, ou bien parce que l'état 
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final l’impose, quoiqu'il existe une réciprocité de relations entre les 
chainons. 

Il est possible que la capacité critique qui ordonne généralement 
un processus, doive son existence et soit conduite par l’état final, 
qu’on veut atteindre ; en d’autres termes, le choix parmi plusieurs 
chemins possibles se fait d’accord avec le résultat final qu’on 
aimerait obtenir. Nous nous trouverons dans ce cas devant un phé- 
noméne qu’on peut ranger parmi les processus de rétro-alimentation. 

L'influence de l’état final sur l'élection du chemin peut se réaliser 
de deux façons différentes. Il peut se produire d’une façon prévoy- 
ante ; on juge dans chaque état intermédiaire l’aptitude de chacun des 
divers états enchaînés avec lui afin d'atteindre l’état final. Il peut 
aussi se produire d’une façon casuelle et empirique : on suit n’importe 
quel chemin, mais il existe la possibilité de juger à la fin si l’état 
où l’on est arrivé est bien l’état recherché ; s’il ne l’est pas, on re- 
prend de nouveau le processus par un chemin différent. 


L'APPRENTISSAGE COMME PROCESSUS D’ ACQUISITION EE 
SES MODES SIMPLES 


Dans les lignes précédentes nous avons attiré spécialement l’at- 
tention sur le résultat de l'apprentissage (idées ou associations 
acquises). Mais il est nécessaire de réfléchir aux processus acquisi- 
tifs de ces images et, surtout, de ces relations et associations. L'étude 
de l'acquisition d'éléments externes et nouveaux par l'individu qui 
apprend est un objet propre des traités de psychologie ; l'étude de 
la façon dont un engin automatique incorpore données et structures, 
relève de la science des mécanismes et de l’automation. Nous for- 
mulons ici quelques considérations sur ces processus, vus dans leur 
ensemble, d’un point de vue de base et essentiel. 

Nous pouvons énumérer deux formes élémentaires d'acquisition 
d’une relation, deux genres de faits qui justifient qu’on établisse une 
relation entre deux éléments de l'individu qui apprend. Ces modes 
sont la contiguité et la recherche simple. 

Le fait que deux éléments de l’individu qui apprend se présentent 
de façon contigué (contiguité spatiale, temporelle, conceptuelle 
ou d’un autre genre) détermine chez les êtres vivants une relation 
entre ces deux éléments contigus. Il est plus difficile de trouver, 
dans les mécanismes, des circuits ou des organes qui permettent la 
création de cette liaison simple par contiguité, si l’on excepte les 
expressions plus quantitatives et matérielles de la contiguité. 
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L'autre procédé élémentaire d'apprentissage acquis par relation, 
que nous citerons, est la recherche simple. C’est le processus par lequel 
on tâche de mettre en rapport un élément c de la structure interne 
du sujet qui apprend, avec un autre s choisi parmi une série d’élé- 
ments Sy, So, S3 Sas $5... (fig. 2). Mais le rapport doit se faire seule- 
ment avec l'élément qui possède la qualité g, soit, par exemple, sy. 


[SiDa [Sn] 


TG 2 


On commencera la recherche en parcourant les éléments s,, afin 
de savoir s'ils possèdent la qualité g. La recherche exige dans le 
sujet qui apprend une capacité critique adéquate d'examiner et 
un élan qui maintient la tension de l’activité investigatrice, jusqu’à 
la trouvaille de l’élément doté de la particularité ou qualité g. 

La recherche simple se termine quand cet élément a été trouvé 
et lorsqu'une association s'établit comme résultat de cet apprentis- 
sage. On peut réaliser la recherche à un niveau matériel, c’est-a- 
dire par des méthodes qui ont un caractère physique, comme par 
exemple, le contact matériel. On peut aussi la réaliser au niveau 
intellectuel. Ici la vérification de chaque élément se présente comme 
une analyse conceptuelle. 


LES MÉTHODES COMPLEXES D'APPRENTISSAGE ET LA CONDUITE 
APORIOLYTIQUE 


Nous terminons ces remarques — dont nous avons l'intention 
de publier les développements futurs — par quelques observations 
sur la méthode qui constitue une base de l’apprentissage complexe. 

Nous la dénommerons conduite aporiolytique. 
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Les auteurs anglais ont parlé d’une « conduite tendant à la réso- 
lution d’un problème», en rapport avec l'apprentissage. Nous appel- 
lerons cette conduite « aporiolytique » dans cet article. C’est l’en- 
semble des activités d’un système fermé, qui doit tendre à ce que ce 
système soit placé finalement dans un état préfixé ; c’est un proces- 
sus complexe de recherches, comme nous l’avons expliqué plus haut. 
L'activité, et on pourrait même dire l’état d’«inquiétude» du 
système, est produite par l’état final et il cessera seulement quand 
on aura atteint ce dernier état. Pour cela, nous incluons la con- 
duite aporiolytique parmi les phénomènes de «ré-alimentation » 
ou « feed-back ». 


FIG. 3. 


L'individu ou le système qui exerce ses fonctions par une conduite 
aporiolytique, tâche d’abord d'atteindre un état final. Si nous. 
considérons comme apprentissage, l'intention de chercher un état 
final, il réalise vraiment un apprentissage ; mais il ne réalise, un 
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apprentissage que s’il lui reste une empreinte sélective de cette 
conduite. 

On peut représenter (fig. 3) une conduite aporiolytique d’une 
façon schématique, par une chaîne centrale d'activités ou d'éléments 
enchaînés, qui finit à l’état final recherché. Il existe également des 
chaînes latérales incomplètes et interrompues, parce qu’elles n’at- 
teignent pas l’état final. 

Quand l'individu a gardé une empreinte de la chaîne arrivée 
jusqu’à sa fin ; il réalise un apprentissage utile, parce que cette struc- 
ture acquise assurera dans le futur une étape rapide de l’état ini- 
tial jusqu’au final, sans essais et sans tâtonnements. 
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